El creador del Proyecto Genoma Humano dirige ahora Nebula Genomics, una empresa que pretende comerciar con los datos secuenciados del genoma de los clientes que lo soliciten. George Church, junto a colaboradores de otras compañías, inversionistas y las empresa Veritas Genetics proponen que cualquiera pueda vender la información obtenida con sus genomas tras invertir previamente en la secuenciación del mismo unos 1.000 dólares. Además, las transacciones se realizarían utilizando la tecnología blockchain utilizada para transacciones de valor seguro como Bitcoin.
Así lo explica en el libro blanco publicado por su nueva iniciativa llamada Nebula Genomics, que puedes leer en pdf.
Esta posibilidad de que los propietarios del genoma analizado puedan ser vendidos a la industria farmacéutica contrasta con otras compañías, especialmente 23andMe, que retienen la propiedad de los datos de los usuarios derivados de muestras genéticas del hisopo de saliva, dejando a los clientes fuera de los ingresos cuando los venden a terceros.
Quid pro quo en la secuenciación del Genoma Humano
Para poder utilizar mejor los datos genómicos, los investigadores necesitan muestras de muchas personas. Sin embargo, el número de personas que participan en la secuenciación del genoma personal es bajo, debido a problemas de precio y privacidad.
La única forma de involucrar a muchas más personas, sugiere el grupo, es garantizar que sus datos solo irán donde lo decidan y reduciendo los costos.
Lo cual, según afirman, solo puede ocurrir al permitir que aquellos que dan muestras vendan sus datos a empresas que trabajan en grandes esfuerzos de investigación. Nebula Genomics, afirman, está en condiciones de hacer que eso suceda. Eso revelaría tendencias que son útiles para identificar factores de enfermedad hereditaria actualmente desconocidos.
Seguridad en el comercio de datos del genoma
El mercado del genoma humano estaría protegido mediante tecnología blockchain. Los compradores y vendedores usarían tokens Nebula como dinero. Aquellos que deseen tener su genoma secuenciado, por ejemplo, comprarían una ficha, que a su vez podría vender a otro comprador, recuperando así su gasto inicial. Pero, al igual que con Bitcoin, el valor de los tokens puede cambiar dependiendo de una variedad de factores.
Dado que los tokens solo se pueden canjear comprando los datos de ADN de alguien, su valor dependerá de la disposición de las grandes compañías para usarlos para pagar los datos.
Así, Nebula Genomics aprovechará la tecnología blockchain para eliminar intermediarios y facultar a las personas para que posean sus datos genómicos personales. Esto efectivamente reducirá los costos de secuenciación y mejorará la privacidad de los datos, lo que dará como resultado el crecimiento de datos genómicos. “Nuestro protocolo abierto —asegura su web— aprovechará el crecimiento de los datos genómicos permitiendo a los compradores de datos agregar de manera eficiente los datos estandarizados de muchas personas y bancos de datos genómicos.”
Google, el Genoma Humano y el Big Data
Empresas como Google Genomics han estado buscando activamente datos de hospitales y universidades, a fin de tener la mayor cantidad de datos genómicos almacenados como sea posible.
El objetivo general es proporcionar un servicio a los investigadores que estudian los genomas como un medio para curar enfermedades, principalmente el cáncer.
El costo de descifrar un solo genoma humano se ha desplomado en los años de investigación, lo que ha resultado en una explosión de descodificaciones que se están realizando. Pero los datos han sido almacenados en muchos lugares diferentes, que no están conectados entre sí. Además, almacenar los datos de una sola decodificación equivale a unos 100 gigabytes por persona, lo que puede sumarse rápidamente. Afortunadamente, los investigadores han encontrado una manera de reducir la información innecesaria, permitiendo que un solo genoma ocupe solo un gigabyte, lo que hace que sea más factible almacenarlo. Pero, incluso en esa cantidad más pequeña, debido al Big Data de los genomas que se decodifican, los requisitos de espacio comienzan a acumularse. Ahí es donde entra Google con Google Genomics , un proyecto que combina capacidades de almacenamiento masivo con tecnología de recuperación de clase mundial, cortesía del motor de búsqueda de Internet de Google.
Tal servicio no es gratuito, por supuesto, Google cobra 25 dólares por genoma completo y solo veinticinco centavos por la versión reducida. Es lo que los institutos de investigación generalmente tendrían que pagar para almacenar los datos en sus propios servidores, sin las capacidades de búsqueda. El proyecto de la base de datos ya ha tenido cierto éxito, ya que algunos estiman que los datos que representan miles de genomas ya están en la base de datos, incluyendo aproximadamente 2,6 petabytes del National Cancer Institute.
Google Genomics ofrece, aún así, herramientas y características esenciales y únicas en esta titánica labor:
Interoperabilidad
La implementación del estándar abierto de Global Alliance for Genomics and Health es interoperable en diversos repositorios de genomas y lo respaldan tecnologías de Google, como Bigtable y Spanner.
Completamente integrado
Utiliza la infraestructura de nube de Google para tus necesidades bioinformáticas. Esto incluye máquinas virtuales rápidas, almacenamiento escalable y la opción de bases de datos SQL y NoSQL completamente administradas, como Bigtable y Datastore.
Seguridad y cumplimiento
Estos factores están incluidos en sus acuerdos de socio comercial en relación con la HIPAA. Disponible a través de la autorización de FedRAMP para operar programas piloto en la investigación del cáncer en la nube, realizados por el National Cancer Institute.
Procesamiento de datos en tiempo real
Procesamiento y análisis de datos genómicos en tiempo real con BigQuery, en un estilo de programación literaria con Cloud Datalab, en lotes con GATK en Google Genomics, con Apache Spark o Cloud Dataflow, o bien, con un clúster de Grid Engine.
Alta escalabilidad
Puedes cargar petabytes de lecturas de secuencias, variantes, referencias, anotaciones y procesar todo con eficacia.
https://youtu.be/ExNxi_X4qug