Inova Translational Medicine Institute (ITMI), instituto de investigación médica norteamericano, está utilizando Cloudera Enterprise para analizar de forma segura colecciones masivas de datos clínicos y genómicos a altas velocidades.
Como parte del Centro Inova de Salud Personal (ICPH, por sus siglas en inglés) el equipo de científicos, investigadores, analistas y colaboradores de ITMI aplica algoritmos de Machine Learning en terabytes de información clínica y genómica para identificar los vínculos genéticos con las enfermedades.
De ese modo, pueden hacer descubrimientos a partir de la información de los datos y, en colaboración con el médico, desarrollan planes de tratamiento personalizados para los pacientes. Este enfoque también se conoce como medicina de precisión y tiene el poder de ayudar a los pacientes a vivir vidas más largas y saludables.
La genética juega un papel fundamental dentro de la mayoría de las principales causas de muerte en los Estados Unidos, incluyendo enfermedades cardíacas, cáncer y diabetes. El Instituto recoge datos clínicos de miles de pacientes nacidos en más de 110 países. El ADN de una sola persona contiene seis mil millones de bits de información. Mapear los códigos de ADN individuales en las secuencias del genoma, ayuda a los científicos a determinar la causa de las enfermedades y a descubrir nuevos tratamientos. Como parte de este proceso, ITMI también está reuniendo lo que se espera sea una de las bases de datos de secuencias del genoma más grandes del mundo que también se encontrarán conectados a la historia del paciente en un sistema de atención médica.
«El desafío para los investigadores y científicos de ITMI era analizar nuestra colección de datos en bruto, sumamente compleja y masiva, de forma más rápida y eficiente, y traducir las ideas en un cuidado práctico del paciente. Ahora podemos obtener respuestas en minutos y segundos y podemos encontrar correlaciones que no hemos podido ver antes«, explica Aaron Black, Chief Data Officer en ITMI. «Nuestros investigadores solían gastar el 80 por ciento de su tiempo en disputas de datos y sólo una pequeña cantidad de tiempo en el análisis. Estamos en el proceso de revertir eso. Ahora podemos acelerar el ritmo del descubrimiento genómico y cambiar drásticamente la forma en que interactuamos con nuestros equipos de investigación. Creemos que mejorará nuestra capacidad de proporcionar los tratamientos correctos a los pacientes adecuados y, en última instancia, mejorar los resultados. Cloudera ha hecho que esto sea posible”.
La plataforma de Cloudera permitió a ITMI optimizar su análisis de datos genómicos para su descubrimiento. Este análisis genómico de datos permite a un científico de bioinformática estudiar las correlaciones genómicas de personas con condiciones como la artritis, enfermedades autoinmunes o cáncer. En el pasado, dado el tamaño masivo de genomas enteros, este proceso podía tomar a ITMI alrededor de dos meses para lograrlo. Utilizando Cloudera, ITMI puede realizar análisis de datos de extremo a extremo en una semana. En el futuro, ITMI espera hacer estos análisis de datos en sólo unas horas.
Trabajando con Cloudera, ITMI construyó una infraestructura de bioinformática para la recopilación de datos de genomas del Instituto, emparejados con el registro clínico. La infraestructura fue diseñada para almacenar y procesar esta convergencia de datos biológicos a velocidades y escalas propias del futuro.
Mientras que un genoma equivale a más de tres mil millones de pares de bases de ADN, ITMI actualmente rastrea aproximadamente 9.000 genomas completamente secuenciados, con intención de llegar a los 15.000 en el futuro. La moderna base de datos analítica de Cloudera, impulsada por Apache Impala (incubating), permite acceder a analíticas SQL de alto rendimiento para el Big Data. Con la flexibilidad, la escala y la velocidad que proporciona Cloudera, el equipo de ITMI podrá aplicar la concurrencia de varios usuarios y desarrollar análisis de alto rendimiento de datos genómicos recopilados de madres, padres y niños inscritos en diversos estudios. Por ejemplo, ITMI ha sido capaz de aprovechar su experiencia en análisis clínico y genómico para ayudar a descubrir anomalías congénitas previamente no diagnosticadas en los bebés. Este es un proceso lento e iterativo, pero gracias a herramientas como Cloudera, ITMI espera poder acelerar estos descubrimientos para ayudar a estas familias.
«La arquitectura de datos única y de vanguardia de Inova combina la diversidad de su comunidad de pacientes y su amplitud de innovación. Cloudera se enorgullece de trabajar con estos pioneros en genética clínica que están realizando grandes avances en la investigación genómica y la atención personalizada«, ha explicado Shawn Dolley, Industry leader, Health and Life Science en Cloudera. «ITMI está avanzando en la forma en que los investigadores y los médicos puedan consumir y gestionar los datos genómicos y moleculares. Combinando los datos clínicos y genéticos y trabajando sobre la base del Machine Learning, transformaremos las decisiones que estamos tomando de cara al cuidado de los pacientes, la prevención de enfermedades y la precisión en la salud pública«.
Recursos adicionales
● Puedes ver aquí la historia de éxito de Inova
● Descubre cómo el despliegue de Cloudera Enterprise por parte de Inova Health System fue nombrado finalista para el premio 2017 BioIT World Best Practice Award, por facilitar el crecimiento de la medicina personalizada y la genómica.
● Para más información, puedes descargar este PDF sobre el Whole Genome Research Drives Healthcare to Hadoop
● Visita PSB Nova cracking the Code of Life para más información sobre el genoma humano
● Consulta aquí otros reconocimientos notables de la industria para Cloudera