Los investigadores han ampliado considerablemente el catálogo de variaciones genéticas humanas conocidas.
Los conjuntos de datos resultantes, compartidos en dos publicaciones consecutivas en la revista Nature, constituyen lo que podría ser la visión más completa del genoma humano hasta la fecha.
El primer artículo, dirigido conjuntamente por el Laboratorio Europeo de Biología Molecular (EMBL), la Universidad Heinrich Heine de Düsseldorf (HHU) y el Centro de Regulación Genómica (CRG) de Barcelona, analizó los genomas de 1019 personas procedentes de 26 poblaciones de los cinco continentes.
Los investigadores buscaron específicamente variantes estructurales en el genoma humano.
Se trata de grandes fragmentos de ADN que han sido eliminados, duplicados, insertados, invertidos o mezclados.
Las diferencias en las variantes estructurales entre individuos pueden suponer cambios en miles de letras de ADN a la vez, lo que a menudo inactiva genes y provoca muchas enfermedades raras y cánceres.
El equipo encontró y clasificó más de 167 000 variantes estructurales en los 1019 individuos, duplicando la cantidad conocida de variación estructural en el pangenoma humano, una referencia que une el ADN de muchas personas en lugar de basarse en un solo genoma.
Cada persona presentaba una media de 7,5 millones de letras en cambios estructurales, lo que subraya la gran cantidad de edición genómica que realiza la naturaleza por sí misma.
«Hemos encontrado un tesoro oculto de variaciones genéticas en estas poblaciones, muchas de las cuales estaban infrarrepresentadas en conjuntos de referencia anteriores. Por ejemplo, el 50,9 % de las inserciones y el 14,5 % de las deleciones que hemos encontrado no se habían registrado en catálogos de variaciones anteriores. Es un paso importante para cartografiar los puntos ciegos del genoma humano y reducir el sesgo que durante mucho tiempo ha favorecido a los genomas de ascendencia europea, allanando el camino para terapias y pruebas que funcionen igual de bien para personas de todo el mundo», afirma el Dr. Bernardo Rodríguez-Martín, coautor correspondiente del estudio.
Alrededor de tres de cada cinco (59 %) de las variantes descubiertas se produjeron en menos del 1 % de los individuos, un nivel de rareza crucial para el diagnóstico de enfermedades genéticas, ya que puede ayudar a filtrar las variaciones inofensivas de forma más eficaz.
En las pruebas, el nuevo conjunto de referencia reduce la lista de mutaciones sospechosas de decenas de miles a solo unos cientos, lo que acelera el camino hacia el diagnóstico de síndromes genéticos raros y otros tipos de enfermedades como el cáncer.
Bernardo Rodríguez-Martín comenzó a trabajar en el proyecto en el laboratorio de Jan Korbel en el EMBL y lo completó tras trasladarse al CRG cuando creó su propio grupo.
Desarrolló SVAN, un software que clasifica cada cambio en el ADN, como «pieza extra copiada» o «fragmento eliminado», lo que ayuda al equipo a examinar los datos genéticos para discernir nuevos patrones.
SVAN reveló que más de la mitad de la diversidad recién cartografiada en el genoma humano se encuentra en tramos de ADN altamente repetitivos, partes del genoma que antes se descartaban como basura o demasiado difíciles de estudiar.
«Los elementos repetitivos representan un rico y hasta ahora ignorado reservorio de diversidad genética. Son protagonistas clave de la diversidad, las enfermedades y la evolución humanas», afirma Emiliano Sotelo-Fonseca, estudiante de doctorado del CRG y coautor del primer estudio.
Estos segmentos repetitivos de ADN incluyen elementos móviles, también conocidos como «genes saltarines» debido a su capacidad para copiarse y pegarse a sí mismos en todo el genoma.
Los investigadores descubrieron que, entre los miles de elementos móviles del genoma humano, la mayor parte de la mutagénesis germinal se deriva de la actividad de unas pocas docenas de elementos muy activos.
Por ejemplo, se descubrió que un elemento LINE-1 particularmente hiperactivo secuestraba un potente interruptor regulador para hacer muchas más copias de sí mismo de lo habitual, esparciendo material genético adicional por el ADN de muchas personas.
Los investigadores observaron un truco similar con otra clase de genes saltarines llamados SVA.
«Nuestro trabajo muestra cómo los elementos móviles aumentan su actividad secuestrando los botones de regulación de nuestro genoma, una estrategia subestimada que podría contribuir a impulsar enfermedades como el cáncer y que merece más investigación», afirma el Dr. Rodríguez-Martín.
El segundo artículo, dirigido conjuntamente por el Laboratorio Europeo de Biología Molecular (EMBL) y la Universidad Heinrich Heine de Düsseldorf (HHU), utilizó una muestra mucho más pequeña, de solo 65 individuos, pero combinó varios métodos de secuenciación potentes para reconstruir genomas humanos con un nivel de detalle sin precedentes.
Este enfoque ayudó a los investigadores a descodificar los tramos más difíciles de leer, incluidos los centrómeros.
El ensamblaje casi completo y sin lagunas de todos los cromosomas de estas personas ayudó a los investigadores a detectar grandes variantes genéticas en esas regiones que no se habían detectado en el primer artículo ni en otros estudios.
Los resultados muestran que la combinación del enfoque del primer artículo, con muchos genomas secuenciados a una profundidad moderada, con el enfoque del segundo artículo, con unos pocos genomas secuenciados con gran detalle, es la vía más rápida para obtener un mapa completo e inclusivo de la diversidad genética humana.
«Un estudio utiliza menos potencia de secuenciación, pero una cohorte mucho mayor. El otro utiliza una cohorte más pequeña, pero mucha más potencia de secuenciación por muestra. Esto ha llevado a conclusiones complementarias», afirma el Dr. Jan Korbel, jefe de grupo y director interino del EMBL Heidelberg, y coautor principal de ambos estudios.
Ambos artículos han vuelto a secuenciar individuos del proyecto 1000 Genomes, el esfuerzo histórico que cartografió la diversidad genética mundial en 2015.
El proyecto se basó en la tecnología de secuenciación de «lectura corta», que solo podía leer fragmentos muy pequeños de ADN cada vez.
Estos eran demasiado cortos para revelar grandes fragmentos de ADN que faltaban o estaban copiados, largos tramos que cambiaban de dirección o repeticiones que parecían casi idénticas en muchos lugares.
Los avances logrados por los nuevos estudios han sido posibles gracias a la secuenciación de «lectura larga», una tecnología reciente que lee de miles a decenas de miles de letras de ADN de una sola vez, lo que ayuda a los investigadores a encontrar grandes cantidades de variaciones ocultas que no se podían detectar con los métodos anteriores.
Los dos artículos también suponen un importante avance hacia la construcción de una referencia del pangenoma humano.
Durante los últimos veinte años, los científicos han utilizado la secuencia de ADN de una persona como «estándar» del genoma humano.
Un pangenoma sería más adecuado para la medicina personalizada, ya que reflejaría la diversidad global.
Mediante el desarrollo de algoritmos innovadores que pueden analizar 1019 genomas diversos en cuanto a amplitud y 65 genomas ultra completos en cuanto a profundidad, los investigadores proporcionan una hoja de ruta que hace que la creación de un verdadero pangenoma humano sea más práctica que una simple aspiración, sobre todo teniendo en cuenta que los costes de la secuenciación de lectura larga están disminuyendo.
«A través de estos estudios, hemos creado un recurso completo y relevante desde el punto de vista médico que ahora pueden utilizar los investigadores de todo el mundo para comprender mejor los orígenes de la variación genómica humana y ver cómo se ve afectada por una gran cantidad de factores diferentes», afirma Tobias Marschall, profesor de la Universidad Heinrich Heine de Düsseldorf y coautor principal de ambos estudios.
«Este es un gran ejemplo de cómo la investigación colaborativa abre nuevas perspectivas en la ciencia genómica y supone un paso hacia un pangenoma humano más completo».
Fuente: Centro de Regulación Genómica