¡Buscando rastros de humanos antiguos en el ADN moderno!
Desafortunadamente, los fósiles similares son muy raros. Por ejemplo, el conocimiento de los denisovanos se basa en el ADN extraído del hueso de un dedo. Si bien esas combinaciones de poblaciones híbridas tempranas y otras combinaciones ancestrales son fáciles de encontrar, pueden ser difíciles de probar cuando se trata de evidencia física. Es posible que sólo existan pistas sobre su presencia en el ADN de determinadas personas. Aun así, pueden ser más sutiles que los genes neandertales y denisovanos. Los modelos estadísticos ayudan a los científicos a inferir la existencia de estas poblaciones sin datos fósiles: por ejemplo, un estudio de 2013 sobre patrones de variación genética entre humanos antiguos y modernos mostró que había una población humana desconocida relacionada con los híbridos denisovanos (o sus ancestros). Pero los expertos creen que estos métodos inevitablemente también ignoran muchos detalles.
¿Quién más ha contribuido al genoma humano hoy? ¿Cómo son estas poblaciones? ¿Dónde viven? ¿Con qué frecuencia interactúan y se aparean con otras especies humanas? En un artículo publicado en Nature Communications, los investigadores demuestran el potencial de las técnicas de aprendizaje profundo para ayudar a completar algunas piezas faltantes que algunos expertos tal vez ni siquiera sepan que existen. Profundizando, identificaron evidencia de otro grupo: un ancestro humano desconocido en Eurasia que podría haber sido un híbrido de neandertales y denisovanos, o un pariente de los denisovanos. Este trabajo apunta al uso futuro de la inteligencia artificial en paleontología, no sólo para identificar huellas imprevistas sino también para revelar piezas faltantes de nuestra evolución.
Los métodos estadísticos actuales implican detectar las mismas características en cuatro genomas simultáneamente, lo que es una prueba de similitud pero no necesariamente una prueba de ascendencia real; ya que muchos métodos diferentes pueden explicarlo. Una pequeña mezcla de genes reveló. Por ejemplo, estos análisis podrían mostrar que los genomas de los europeos y los neandertales modernos comparten algunas características, pero difieren de los de los africanos modernos. Sin embargo, esto no significa que estos genes procedieran de un cruce entre ancestros neandertales y europeos. Estos últimos pueden haberse reproducido con poblaciones estrechamente relacionadas con los neandertales, en lugar de con los propios neandertales. En ausencia de evidencia física que muestre cuándo, dónde y cómo se originaron estas antiguas variantes genéticas hipotéticas en las poblaciones humanas, es difícil determinar cuál de los muchos ancestros putativos fue.
La técnica es simple y poderosa, pero todavía plantea muchos problemas para comprender la evolución, afirmó John Hawks, paleoantropólogo de la Universidad de Wisconsin-Madison. Los métodos de aprendizaje profundo intentan explicar los niveles de flujo de genes. Aunque el nivel de flujo genético es demasiado pequeño en comparación con los métodos estadísticos, proporciona un modelo más amplio y complejo para explicarlo. A través del entrenamiento, las redes neuronales pueden aprender a clasificar patrones en datos genómicos basándose en la historia de las poblaciones que tienen más probabilidades de producir los patrones, sin tener que decirles cómo hacer esas conexiones.
El uso de tecnología de aprendizaje profundo podría encontrar rastros de humanos antiguos que los investigadores nunca sospecharon. En primer lugar, no hay razón para pensar que los neandertales, los denisovanos y los humanos modernos sean las únicas tres poblaciones en el contexto de la historia humana. Según Hawkes, puede haber docenas de poblaciones de este tipo.
El antropólogo Jason Lewis, de la Universidad Estatal de Nueva York en Stony Brook, está de acuerdo y dice: Nuestra imaginación siempre es limitada porque nos centramos en personas vivas o fósiles encontrados en Europa, África y Asia occidental. Curiosamente, la tecnología de aprendizaje profundo reenfoca estas posibilidades, que ya no están limitadas por nuestra imaginación.
Parece poco probable que el aprendizaje profundo resuelva los problemas de los paleontólogos porque el método normalmente requiere grandes cantidades de datos de entrenamiento. Tomemos como ejemplo su clasificador de imágenes más común. Cuando un experto entrena a un modelo para que reconozca la imagen de un gato, tiene miles de imágenes con las que entrenar y el propio experto sabe si funciona porque sabe cómo debería verse un gato. Al carecer de datos antropológicos y paleontológicos relevantes, los investigadores que quieren utilizar técnicas de aprendizaje profundo tienen que crear sus propios datos para hacerlos más inteligentes. Oscar Lao, investigador del Centro Nacional de Análisis del Genoma de Barcelona, afirma: "Estamos jugando una mala pasada. Podemos utilizar datos ilimitados para entrenar el motor de aprendizaje profundo porque utilizamos simulaciones.
Los investigadores generaron miles de historias evolutivas simuladas basadas en diferentes detalles demográficos: el número y tamaño de las poblaciones ancestrales, las tasas de mestizaje cuando se separaron unas de otras, etc. A partir de estas historias simuladas, los científicos han creado numerosos genomas simulados para la vida moderna. Entrenaron estos genomas en algoritmos de aprendizaje profundo para aprender qué modelo evolutivo tenía más probabilidades de producir un modelo genético determinado. Luego, el equipo utilizó inteligencia artificial para inferir la historia que mejor coincidía con los datos genómicos reales. Finalmente, el sistema concluyó que un grupo humano previamente no identificado también contribuyó a la ascendencia de los descendientes asiáticos. A juzgar por los patrones genéticos involucrados, estas personas pueden haber sido un grupo único que resultó del mestizaje de denisovanos y neandertales hace 300.000 años
o fueron creados por denisovanos poco después. Un grupo evolucionó a partir de los descendientes de Washington. Esta no es la primera vez que se utiliza el aprendizaje profundo de esta manera. Algunos laboratorios en este campo han aplicado métodos similares para abordar otras pistas en la investigación evolutiva. ¿Andrew de la Universidad de Oregon? Un equipo de investigadores dirigido por Andrew Kern utilizó métodos basados en simulación y técnicas de aprendizaje automático para distinguir entre varios modelos de cómo evolucionan las especies, incluidos los humanos. Se ha descubierto que la mayoría de las adaptaciones favorecidas por la evolución no dependen de la aparición de nuevas mutaciones beneficiosas en una población, sino de la expansión de la variación genética existente. La aplicación del aprendizaje profundo a estos nuevos problemas está produciendo resultados interesantes.
Hay algunos problemas. En primer lugar, si la historia evolutiva humana real difiere del modelo de simulación entrenado mediante el método de aprendizaje profundo, la técnica producirá resultados erróneos. Este es un problema al que Cohen y otros han estado enfrentando y todavía queda mucho trabajo por hacer para mejorar la precisión. "Creo que las aplicaciones de la inteligencia artificial en genómica han sido muy exageradas", afirmó Joshua Akey, ecologista y biólogo evolutivo de la Universidad de Princeton. La tecnología de aprendizaje profundo es una nueva herramienta fantástica, pero es solo un método y no resuelve todos los misterios y complejidades que queremos comprender en la evolución humana.
Algunos expertos se muestran incluso escépticos. David Pulby, paleontólogo de la Universidad de Harvard y del Museo Peabody, escribió en un correo electrónico: Mi opinión es que, además de un análisis reflexivo, inteligente y manual, la densidad y la calidad de los datos no son ideales. Sin embargo, otros paleontólogos y genetistas lo ven como un buen paso adelante para predecir posibles futuros descubrimientos de fósiles y variaciones genéticas que deberían haber existido hace miles de años. Creo que el aprendizaje profundo realmente va a hacer avanzar la genética de poblaciones y probablemente otros campos en los que tenemos acceso a los datos, pero no a los procesos que los producen.
Más o menos al mismo tiempo que Cohen y otros genetistas de poblaciones y biólogos evolutivos estaban desarrollando técnicas de inteligencia artificial basadas en simulación para resolver el problema, los físicos también estaban trabajando en cómo examinar el Gran Colisionador de Hadrones y otras partículas. Los aceleradores generan grandes cantidades de datos. La investigación geológica y los métodos de predicción de terremotos también están empezando a beneficiarse de los métodos de aprendizaje profundo.
"Realmente no sé qué va a pasar, pero siempre es bueno tener nuevos enfoques", dijo Nick Patterson, biólogo computacional del MIT y del MIT Broad Institute. Si responde bien a nuestras preguntas, ¡intentaremos desarrollarlo!
Boko Park-Popular Science|Revistas de referencia: "Nature", "Nature Communications"
Texto: jordana cepelewicz/Quantum Magazine/Quantum Newsletter
DOI : 10.1038/s 41586-018-0455-x
DOI:10.1038/naturaleza 12886
DOI:10.1038/s 41467-018-08089-7
Boko Jardín: transmitiendo la belleza de la ciencia cósmica