Denodo Technologies, especialista en virtualización de datos, acaba de anunciar que el Instituto Nacional el Cáncer, (NCI) de Estados Unidos, integrado dentro de los Institutos Nacionales de la Salud (NIH) y del Departamento de Salud y Servicios Humanos de los Estados Unidos, ha elegido la Plataforma de Virtualización de Datos de Denodo para transferir grandes conjuntos de datos garantizando al mismo tiempo eficiencia y exactitud. Más abajo fragmentos del comunicado de prensa.
El Instituto Nacional del Cáncer (NCI) y el Instituto de Investigación Nacional del Genoma Humano (NHGRI), se han unido recientemente en la ejecución del proyecto conocido como “El Atlas del Genoma del Cáncer” (TCGA). Su misión es catalogar las mutaciones genéticas responsables del cáncer mediante la secuenciación del genoma y la bioinformática, haciendo estos datos genómicos disponibles para una comunidad de investigación más amplia.
El NIH utiliza la plataforma de virtualización de datos de Denodo para conectarse a las distintas fuentes de los datos del genoma, aplicar transformaciones, producir los conjuntos de datos finales y subir periódicamente estos conjuntos de datos en los servidores ICGC.
En su trabajo diario el NIH se enfrentaba a importantes obstáculos a la hora de mover de forma eficiente y segura grandes volúmenes datos del genoma del cáncer de TCGA y al resto de las organizaciones involucradas en este proyecto. Al llevar a cabo este trabajo el NIH se encontró con que la información no era escalable, no permitía incluir todos los datos del genoma del TCGA, que formaban parte de cientos de millones de filas de datos a través de más de 25 variaciones de cáncer.
El NIH decidió entonces que la virtualización de datos sería el método preferido para transferir datos entre los distintos sistemas involucrados en el proceso, y en concreto la plataforma elegida fue la desarrollada por Denodo.
El proceso de transformación incluyó tres pasos importantes: la suma del paciente y los datos de prueba, la conversión de estos datos en los formatos necesarios, utilizando la información de mapas, y en tercer lugar la creación de los archivos de resultados finales en formato CSV. Por último, el programador incorporado dentro de la plataforma de virtualización de datos de Denodo ejecuta un proceso FTP una vez al trimestre, para cargar los archivos en los servidores de los distintos organismos colaboradores.
Mediante el despliegue de la plataforma de virtualización de datos de Denodo, NIH obtuvo una serie de beneficios entre los que cabria destacar una mayor escalabilidad, un aumento de la eficiencia y un incremento de la precisión, y como consecuencia de todo ello una mayor precisión en los datos finales.