Se llama ELIXIR y es la mayor infraestructura de datos de ciencias de la vida en Europa. Su objetivo es gestionar, explotar y difundir la gran cantidad de información que genera hoy día la investigación biomédica. Gestionada como proyecto especial del Laboratorio Europeo de Biología Molecular, se organiza de forma desconcentrada en forma de un dispositivo central para compartir una red de datos (hub) y nodos distribuidos, que opera y gestiona en el sentido más amplio una colección interrelacionada de recursos de datos biológicos y herramientas científicas.
España participa como miembro de pleno derecho desde el pasado mes de octubre 2015 aunque, hasta el momento, había estado presente como observador. El Instituto de Salud Carlos III, dependiente de la Secretaría de Estado de I+D+i es el organismo que representa al país en ELIXIR y coordina a las instituciones científicas españolas integradas en el Instituto Nacional de Bioinformatica, que actúa como nodo científico español. Está constituido por instituciones de primer nivel como son el Centro Nacional de Investigaciones Oncológicas (CNIO), el Centro de Regulación Genómica (CRG) ─que incluye al Centro Nacional de Análisis Genómico─, la Universidad Pompeu Fabra, el Instituto de Investigación Biomédica de Barcelona (IRB) y el Barcelona Supercomputing Center – Centro Nacional de Supercomputación.
La misión del INB es trasladar los desarrollos de ELIXIR a los laboratorios de instituciones de investigación y empresas y servir para la coordinación, integración y desarrollo de los recursos bioinformáticos españoles en genómica, proteómica y medicina traslacional, medicina de precisión o personalizada en el contexto internacional de ELIXIR. Los científicos en España han colaborado ya con la acción piloto de ELIXIR con EMBL-EBI (Instituto Europeo de Bioinfomática) bajo el liderazgo del CRG para desarrollar el Archivo Europeo Genoma-Fenoma.
Una supercomputadora para almacenar un millón de Gigabytes.
El Barcelona Supercomputing Center–Centro Nacional de Supercomputación (BSC-CNS) albergará los datos del Archivo Europeo Genomas y Fenomas (EGA) , que almacena datos de 100.000 personas generados por más de 700 estudios científicos sobre diversas enfermedades, procedentes de 200 centros y grupos de investigación de todo el mundo. Los datos (un millón de Gigabytes) serán analizadas con el supercomputador MareNostrum.
La EGA es la forma de garantizar que los datos de genomas y fenomas, cuya obtención resulta notablemente cara, se pongan a disposición de la comunidad científica mundial, de manera que las investigaciones se puedan acelerar y tengan lugar nuevos descubrimientos. Asimismo, la EGA es la respuesta europea al reto surgido de la necesidad de proteger la privacidad de las personas donantes que han participado en estudios genómicos.
Hasta ahora, la EGA ha constituido un servicio de la EBI-EMBL. Su finalidad consiste en archivar de manera permanente y segura, y compartir de forma controlada, todo tipo de datos genómicos y fenotípicos de personas identificables, resultantes de proyectos de investigación biomédica, especialmente de proyectos relacionados con enfermedades complejas.
Sólo durante los primeros cuatro meses de 2014, los datos almacenados en la EGA se han transferido más de 20.000 veces a casi 5.000 usuarios de grupos de investigación de los cinco continentes.
De esta manera, la EGA garantiza que toda la comunidad científica pueda disponer de estas valiosas datos para llevar a cabo trabajos de investigación que de otro modo serían imposibles.
Actualmente, el volumen total de los datos, una vez comprimidos, es de aproximadamente 1 PB (1 millón de GB). Los últimos 12 meses, el catálogo EGA ha experimentado un crecimiento del 50% en el número de estudios y del 70% en el número de archivos. Se prevé que en los próximos 12 meses el volumen total de archivos se multiplique por tres.
Fuente: UPC y Ministerio de Economía y Competitividad
Foto supercomputador: Cortesía of Barcelona Supercomputing Center (BSC.es)