El binomio secuenciación genómica y supercomputación extrema permitirá la implementación de la medicina de precisión a corto plazo. La genómica es actualmente una de las áreas de investigación que reclama mayor capacidad de cálculo, y el uso de la supercomputación le está permitiendo avanzar a un ritmo inimaginable hace unos años, un campo donde el Centro Nacional de Análisis Genómico de Barcelona es una de las principales referencias en Europa. Más abajo el resto del comunicado.
La investigación genómica gestiona enormes cantidades de datos que necesitan gran capacidad de cálculo y de almacenamiento, una demanda a la que da respuesta la supercomputación biomédica, haciendo posible el avance de la secuenciación masiva, al eliminar los cuellos de botella que se producen en el análisis de los datos resultantes de la secuenciación, y permiten almacenar esta información de manera eficiente. “La magnitud del desafío genómico –explica Ivo G. Gut, director del CNAG- no puede abordarse con el cálculo tradicional. La solución tampoco pasa por aumentar el número de secuenciadores. La clave está en lograr el equilibrio entre secuenciación y supercomputación”
Creado en 2009, el Centro Nacional de Análisis Genómico (CNAG) de Barcelona lleva adelante proyectos a gran escala en la secuenciación y análisis de ADN, garantizando la competitividad de nuestro país en el área estratégica de la genómica. Comenzó a operar en marzo de 2010 con doce secuenciadores de nueva generación que le permiten una capacidad de secuenciación de más de 800 Gbases/día, el equivalente a secuenciar por completo ocho genomas humanos cada 24 horas, lo que le posiciona como uno de los centros europeos con mayor capacidad de secuenciación. Su equipo de bioinformática se apoya en una infraestructura de computación extrema, basada en tecnología de Bull, con 2,7 petabytes de almacenamiento de datos y más de 1200 núcleos de computación, que colocan al CNAG como un centro de referencia en el análisis de datos.
El CNAG participa en proyectos de secuenciación a gran escala en áreas tan diversas como la genética del cáncer, enfermedades raras, las interacciones huésped-patógeno, la preservación de especies en peligro de extinción, los estudios evolutivos y la mejora de las especies de interés agrícola, en colaboración con científicos de universidades, hospitales, centros de investigación y empresas del sector de la biotecnología y del farmacéutico.
Desde el primer día, la capacidad de secuenciación del centro ha ido ligada a una arquitectura de supercomputación potente y escalable. Para conseguirlo Bull trabajó en estrecha colaboración con el CNAG en el diseño e implementación de una infraestructura singular que optimiza computación, almacenamiento y comunicaciones, creando así un entorno flexible que permite aumentar la capacidad de análisis de manera sencilla.
«No se trata solo de aumentar la capacidad de secuenciación con la compra de nuevas máquinas –explica Ivo G. Gut -, sino de diseñar desde el momento cero las infraestructuras computacionales adecuadas, con la ayuda de un socio tecnológico con experiencia en el campo de la genómica. También es clave elegir una infraestructura de núcleo flexible que permita crecer sin límites, junto con los proyectos de genómica».
Debido a la falta de procedimientos estándar en el procesamiento de genoma y para permitir el re-análisis futuro de la información, el CNAG almacena la salida de cada paso en el procesamiento de los datos. Actualmente, el centro es un importante contribuyente en tres grandes iniciativas internacionales: el Consorcio internacional del Genoma del Cáncer (ICGC), el Consorcio Internacional de Investigación de Enfermedades Raras (IRDiRC) y el Consorcio Internacional de Epigenoma Humano (IHEC).
El descenso en los costes de secuenciación está haciendo posible su incorporación al entorno hospitalario. “La implementación completa de la genómica en los sistemas sanitarios pasa por la resolución de ciertos desafíos científicos y tecnológicos. Son estos últimos a los que Bull trata de dar solución a través de sus capacidades en computación extrema”, indica Natalia Jiménez, PhD consultora de salud y ciencias de la vida de Bull. “Un fichero no procesado correspondiente al genoma completo de un individuo puede pesar 150GB y este fichero ha de mapearse contra el genoma de referencia utilizando algoritmos bioinformáticos que requieren un alto poder computacional. Además estos datos deben de almacenarse durante el tiempo que dicten las normativas vigentes que en cualquier caso supera los 5 años”.
Acerca de Bull
Bull es el socio de confianza para datos de la empresa. El Grupo, que se ha establecido firmemente en Cloud y Big Data, integra y gestiona sistemas de alto rendimiento y soluciones de seguridad de principio a fin. La oferta de Bull permite a sus clientes procesar todos los datos disponibles, creando nuevos tipos de demanda. Bull convierte los datos en valor para las organizaciones de una manera totalmente segura.
Bull emplea actualmente a unas 9.200 personas en más de 50 países, con más de 700 empleados totalmente centrado en la I + D. En 2013, Bull registró unos ingresos de 1.300 millones de euros.