Una plataforma en línea brinda a los científicos de todo el mundo una herramienta que reduce la potencia computacional requerida para analizar grandes cantidades de datos de ADN. Con esta reducción de tiempo para identificar nuevos microbios y sus proteínas podría usarse para fabricar cualquier cosa, desde nuevos antibióticos hasta enzimas que degradan el plástico. Se espera que la herramienta ayude a los investigadores a identificar proteínas y enzimas que se pueden utilizar en la agricultura, los productos farmacéuticos, el sector energético y muchas otras industrias.
Este enfoque reduce la potencia computacional requerida para analizar grandes cantidades de datos de ADN e identificar nuevos microbios y sus proteínas, algo esencial en muchas investigaciones y que requiere su tiempo.
La preparación de cultivos bacterianos es una rutina: un científico toma una muestra de una herida, por ejemplo, y cultiva bacterias a partir de ella en placas de Petri de laboratorio.
El problema es que el 99 por ciento de las bacterias en estas y otras muestras no se pueden cultivar de esta manera en el laboratorio. Esto hace que sea extremadamente difícil descubrir los aproximadamente un billón de microbios que existen.
En busca del ADN por secuenciación
Para superar este problema, los científicos introdujeron un enfoque en 1998 llamado secuenciación metagenómica, en el que se toma una muestra, como un balde de agua de mar, de cualquier entorno y luego se analiza en busca de ADN. Los científicos aplican un método llamado «secuenciación de escopeta» (shotgun sequencing) que fragmenta cualquier ADN de la muestra en piezas más pequeñas llamadas lecturas. Estas lecturas cortas metagenómicas se vuelven a ensamblar para identificar genes . A lo largo de los años, se ha extraído una enorme cantidad de datos de secuenciación microbiana de diferentes entornos, pero el análisis requiere métodos de vanguardia, bases de datos de referencia recientes y una enorme destreza computacional.
Para abordar este problema, Intikhab Alam, Vladimir Bajic, Carlos Duarte, Takashi Gojobori y sus colegas, desarrollaron la plataforma de análisis metagenómico KAUST (KMAP).
«Con KMAP, pudimos analizar y comparar 275 millones de genes microbianos en sólo 13 días usando la supercomputadora Shaheen II de KAUST. En comparación, esto habría requerido 522 años usando una sola CPU», dice Alam.
El proceso implica primero ensamblar lecturas de secuenciación cortas en contigs o ensamblajes más largos utilizando herramientas de ensamblaje de metagenómica de última generación. Son estos datos los que se pueden ingresar en el módulo de anotaciones de KMAP. Los científicos pueden ingresar sus propios contigs, genes o catálogos de genes ensamblados en la plataforma o analizar y comparar datos existentes anotados en KMAP de varios hábitats. Para análisis fáciles e interactivos, las tablas de información genética anotadas por KMAP se pueden filtrar mediante el uso del módulo de comparación de KMAP para obtener una visión más profunda de los tipos de microbios que se encuentran en diferentes entornos y sus funciones.
El equipo de KAUST utilizó los datos que reunió para encontrar enzimas microbianas que podrían usarse para degradar los desechos plásticos en los océanos. También examinaron los datos para identificar genes de resistencia a los antibióticos en las bacterias que viven en el suelo y en los respiraderos térmicos submarinos.
«KMAP brindará a los investigadores de todo el mundo acceso equitativo a los datos procesados a través de los recursos computacionales avanzados de KAUST y eliminará la necesidad de habilidades bioinformáticas avanzadas para explorar comunidades y funciones microbianas», dice Gojobori.
Más información: Intikhab Alam et al, KAUST Metagenomic Analysis Platform (KMAP), que permite el acceso a análisis masivos de datos metagenómicos reanotados, Scientific Reports (2021). DOI: 10.1038 / s41598-021-90799-y
Fuente: KAUST