San Juan 8 > A un click > investigadores

Investigadores crearon el árbol genealógico humano más grande

En junio de 2000, dos grupos rivales de investigadores se dieron la mano en el éxito compartido de un hito en la biología: la entrega de un borrador del genoma humano.

Lo que comenzó con un mapa incompleto de nuestros cromosomas ha florecido desde entonces en un vasto tesoro de secuencias individualizadas de todos los rincones del mundo y, en muchos casos, que se remontan muy atrás en el tiempo.

Te puede interesar...

Desafortunadamente, leerlo es más fácil decirlo que hacerlo. No solo es un problema la gran cantidad de datos, las sutiles diferencias en las muestras, los diversos formatos y las técnicas de análisis que priorizan diferentes tipos de errores presentan obstáculos para una interpretación unificada.

Ahora, los investigadores del Big Data Institute (BDI) de la Universidad de Oxford en el Reino Unido han dado un gran paso al fusionar un bosque de más de 3.600 secuencias individuales de 215 poblaciones en un solo árbol enorme.

Las ramas del árbol forman parte de 231 millones de linajes ancestrales alucinantes. En su base hay una extensión de raíces representadas por ocho antiguas secuencias del genoma humano altamente detalladas, con miles de fragmentos más pequeños utilizados para confirmar su lugar en lo profundo de nuestro pasado.

Entre ellos se encuentran tres genomas neandertales, un genoma de un denisovano y una pequeña familia que vivió en Siberia hace más de cuatro mil años.

“Esencialmente, estamos reconstruyendo los genomas de nuestros antepasados y usándolos para formar una serie de árboles evolutivos vinculados que llamamos ‘secuencia de árbol’”, dice el genetista Anthony Wilder Wohns, quien dirigió el estudio mientras completaba su doctorado en el BDI.

“Entonces podemos estimar cuándo y dónde vivieron estos antepasados”, agrega.

Su método de secuencia de árboles hace uso de lo que se conoce como una estructura de datos sucinta, un concepto informático que tiene como objetivo representar los datos en una cantidad óptima de espacio que también limita la cantidad de tiempo necesario para probarlo todo con preguntas.

Podríamos aplicar un pensamiento similar al guardar archivos en nuestra propia computadora, encontrar un compromiso entre comprimir documentos y comprimirlos en largas listas de carpetas, o simplemente guardar todo en el escritorio.

En este caso específico, una secuencia de árbol encuentra correlaciones entre diferentes ramas de un árbol para ayudar a que los grandes conjuntos de información sean más fáciles de estudiar.

Al convertir los datos en gráficos con nodos que representan varios linajes y mapear mutaciones a lo largo de los bordes, las bases de datos genéticas masivas no solo se pueden comprimir en un espacio relativamente pequeño, sino que se puede acceder más fácilmente mediante algoritmos diseñados para buscar estadísticas interesantes.

“El poder de nuestro enfoque es que hace muy pocas suposiciones sobre los datos subyacentes y también puede incluir muestras de ADN modernas y antiguas”, dice Wohns.

La incorporación de etiquetas en las ubicaciones geográficas de las secuencias permitió al equipo estimar dónde podrían haber vivido ciertos ancestros comunes y cómo se movían.

Esto no solo revela eventos que ya sospechamos, como la forma en que las poblaciones humanas migraron de África, sino que sugiere cambios en las densidades de población dentro de los grupos ancestrales de los que todavía estamos aprendiendo, como los denisovanos.

Visualización de linajes ancestrales humanos inferidos a lo largo del tiempo y el espacio.Cada línea representa una relación ancestro-descendiente en nuestra genealogía inferida de genomas modernos y antiguos. El ancho de una línea corresponde a cuántas veces se observa la relación, y las líneas se colorean según la edad estimada del antepasado

Visualización de linajes ancestrales humanos inferidos a lo largo del tiempo y el espacio.Cada línea representa una relación ancestro-descendiente en nuestra genealogía inferida de genomas modernos y antiguos. El ancho de una línea corresponde a cuántas veces se observa la relación, y las líneas se colorean según la edad estimada del antepasado

Gracias a la eficiencia de este proceso, el ya impresionante árbol tiene mucho espacio para crecer a medida que haya más datos genéticos disponibles en el futuro.

Agregar millones de genomas más solo hará que los resultados adicionales sean más precisos, señalando exactamente dónde encaja una secuencia nueva en una genealogía que se extiende por todo el mundo.

“Esta genealogía nos permite ver cómo la secuencia genética de cada persona se relaciona entre sí, a lo largo de todos los puntos del genoma”, dice el genetista evolutivo de BDI, Yan Wong.

Pensando aún más, no hay razón para que el mismo enfoque no pueda aplicarse a otras especies, posiblemente algún día contribuyendo a un tapiz global de vida en la Tierra.

“Si bien los humanos son el foco de este estudio, el método es válido para la mayoría de los seres vivos, desde los orangutanes hasta las bacterias”, dice Wohns.

“Podría ser particularmente beneficioso en la genética médica, al separar las verdaderas asociaciones entre las regiones genéticas y las enfermedades de las conexiones espurias que surgen de nuestra historia ancestral compartida”, concluye.