Aanwijzingen voor onze onbekende Voorouders bevinden zich in ons genoom


Kan diepgaand leren paleontologen en genetici op spoken helpen jagen?

Toen moderne mensen 70.000 jaar geleden voor het eerst uit Afrika migreerden, wachtten althans twee verwante soorten, die nu uitgestorven zijn, al op hen op de Euraziatische landmassa. Dit waren de Neanderthalers en Denisovans, archaïsche mensen die samenspeelden met die vroege modernen, en stukjes van hun DNA achterlatend in het genoom van mensen van niet-Afrikaanse afkomst.

Quanta Magazine


auteur foto

Wat betreft

Oorspronkelijke verhaal herdrukt met toestemming van Quanta Magazine, een redactioneel onafhankelijke publicatie van de Simons Foundation wiens missie het is om het publieke inzicht in de wetenschap te vergroten door onderzoeksontwikkelingen en trends in wiskunde en de fysische en levenswetenschappen te behandelen.

Maar er zijn steeds meer aanwijzingen voor een nog meer ingewikkelde en kleurrijke geschiedenis: een team van onderzoekers meldde zich in Natuur vorige zomer, bijvoorbeeld, dat een botfragment gevonden in een Siberische grot behoorde toe aan de dochter van een Neanderthaler moeder en een Denisovan vader. De bevinding markeerde het eerste fossiele bewijs van een menselijke hybride van de eerste generatie.

Helaas is het zeer zeldzaam om dergelijke fossielen te vinden. (Onze kennis van bijvoorbeeld Denisovans is gebaseerd op DNA dat alleen uit een vingerbeen is gehaald.) Vele andere voorouderlijke combinaties hadden gemakkelijk kunnen plaatsvinden, inclusief die waarbij hybride groepen betrokken waren van eerdere kruisen – maar ze kunnen praktisch onzichtbaar zijn als het gaat om fysiek bewijs. Aanwijzingen voor het voorkomen ervan kunnen in plaats daarvan alleen in het DNA van sommige mensen overleven en zelfs dan kunnen ze subtieler zijn dan de tekens van Neanderthaler en Denisovan-genen daar. Statistische modellen hebben wetenschappers geholpen het bestaan ​​van een aantal van deze populaties zonder fossiele gegevens af te leiden: volgens onderzoek dat eind 2013 is gepubliceerd, wijzen patronen van genetische variatie in oude en moderne mensen op een onbekende menselijke bevolking die is gekruist met Denisovans (of hun voorouders). Maar experts geloven dat deze methoden ook onvermijdelijk veel over het hoofd zien.

Wie heeft er nog meer bijgedragen aan het genoom van vandaag? Hoe zagen deze zogenaamde ghost-populaties eruit, waar leefden ze en hoe vaak hadden ze interactie met andere menselijke soorten?

In een paper vorige maand gepubliceerd in Natuurcommunicatie, toonden de onderzoekers het potentieel voor diepe leertechnieken om te helpen bij het invullen van enkele van de ontbrekende stukken, stukken waarvan deskundigen misschien niet eens op de hoogte waren. Ze gebruikten diepgaand leren om het bewijs van een andere geestespopulatie uit te pluizen: een onbekende menselijke voorouder in Eurazië, waarschijnlijk een Neanderthal-Denisovan-hybride of een familielid van de Denisovan-lijn.

Het werk wijst op de toekomstige bruikbaarheid van kunstmatige intelligentie in paleontologie, niet alleen voor het identificeren van onvoorziene geesten, maar ook voor het blootleggen van de zeer vervaagde voetafdrukken van de evolutionaire processen die hebben gevormd wie we zijn geworden.

Het zoeken naar subtiele handtekeningen

Huidige statistische methoden omvatten het onderzoeken van vier genomen tegelijk voor gedeelde kenmerken. Het is een test van gelijkenis, maar niet noodzakelijkerwijs van werkelijke afkomst, omdat er veel verschillende manieren zijn om de kleine hoeveelheden genetisch mengsel die het blootlegt, te interpreteren. Dergelijke analyses zouden bijvoorbeeld kunnen suggereren dat een moderne Europeaan bepaalde eigenschappen deelt met het Neanderthaler-genoom, maar geen moderne Afrikaan. Maar dat hoeft niet per se in steen te steken dat die genen voortkwamen uit kruising tussen de Neanderthalers en de voorouders van Europeanen. De laatste, bijvoorbeeld, had in plaats daarvan kunnen worden gefokt met een andere populatie, een die nauw verwant is aan de Neanderthalers, maar niet aan de Neanderthalers zelf.

We weten het gewoon niet, want bij gebrek aan fysiek bewijs om aan te geven wanneer, waar en hoe die eeuwenoude hypothetische bronnen van genetische variatie mogelijk geleefd hebben, is het moeilijk om te zeggen welke van de vele mogelijke afgeleide voorgeslachten het meest waarschijnlijk is. De techniek "is krachtig vanwege zijn eenvoud, maar laat veel te wensen over evolutie," zegt John Hawks, een paleoantropoloog aan de Universiteit van Wisconsin-Madison.

De nieuwe methode van diep leren is een poging om het beter te doen, door te proberen niveaus van genstroom te verklaren die te klein zijn voor de gebruikelijke statistische benaderingen, en door een veel uitgebreider en gecompliceerder scala van modellen aan te bieden om dit te doen. Door middel van training kan het neurale netwerk leren verschillende patronen in genomische gegevens te classificeren op basis van de demografische geschiedenis die ze waarschijnlijk hebben veroorzaakt, zonder te worden verteld hoe deze verbindingen tot stand te brengen.

Dit gebruik van diepgaand leren kan spoken onthullen die we niet eens vermoedden. Ten eerste is er geen reden om te denken dat Neanderthalers, Denisovans en moderne mensen de enige drie populaties op de foto waren. Volgens Hawks hadden er best wel tientallen kunnen zijn.

Jason Lewis, een antropoloog aan de Stony Brook University in New York, deelt die mening. "Onze verbeelding werd beperkt door onze focus op levende mensen of op de fossielen die we hebben gevonden in Europa, Afrika en West-Azië," zei hij. "Wat deep learning-technieken op een vreemde manier kunnen doen, is de mogelijkheden opnieuw richten. De aanpak wordt niet langer beperkt door onze verbeeldingskracht. "

De echte waarde van gesimuleerde histories

Diepgaand leren lijkt misschien een onwaarschijnlijke oplossing voor het probleem van paleontologen, omdat dergelijke methoden normaal gesproken enorme hoeveelheden trainingsgegevens nodig hebben. Neem een ​​van de meest voorkomende toepassingen, als een afbeeldingsclassificator. Wanneer experts een model trainen om bijvoorbeeld kattenbeelden te identificeren, hebben ze duizenden foto's waarmee ze het kunnen trainen en ze weten zelf of het werkt, omdat ze weten hoe een kat eruit moet zien.

Maar het gebrek aan relevante antropologische en paleontologische gegevens die beschikbaar waren dwong onderzoekers die diepgaand leren wilden gebruiken om slim te worden, door zelf gegevens te creëren. "We waren een beetje vuil aan het spelen," zei Oscar Lao, een onderzoeker bij het National Center of Genomic Analysis in Barcelona en een van de auteurs van het onderzoek. "We zouden een oneindige hoeveelheid gegevens kunnen gebruiken om de deep-learning-engine te trainen, omdat we simulaties gebruikten."

De onderzoekers genereerden tienduizenden gesimuleerde evolutionaire geschiedenissen op basis van verschillende combinaties van demografische details: het aantal voorouderlijke menselijke populaties, hun grootte, wanneer ze van elkaar afbraken, hun mate van vermenging enzovoort. Uit die gesimuleerde geschiedenissen hebben de wetenschappers een enorm aantal gesimuleerde genomen gegenereerd voor de huidige mensen. Ze hebben hun deep learning-algoritme op deze genomen getraind, zodat het leerde welke soorten evolutionaire modellen het meest waarschijnlijk bepaalde genetische patronen produceerden.

Het team stelde vervolgens de kunstmatige intelligentie los om de geschiedenissen af ​​te leiden die het best passen bij de werkelijke genomische gegevens. Uiteindelijk concludeerde het systeem dat een voorheen ongeïdentificeerde menselijke groep ook had bijgedragen aan de afkomst van mensen van Aziatische afkomst. Van de betrokken genetische patronen waren die mensen zelf waarschijnlijk een afzonderlijke populatie die ontstond uit de kruising van Denisovans en Neanderthalers rond 300.000 jaar geleden, of een groep die kort daarna afstamde van de Denisovan-lijn.

Dit is niet de eerste keer dat deep learning op deze manier is gebruikt. Een handvol labs in het veld hebben soortgelijke methoden toegepast om andere draden van evolutionair onderzoek aan te pakken. Eén onderzoeksgroep, geleid door Andrew Kern aan de Universiteit van Oregon, heeft een op simulatie gebaseerde benadering en machine learning-technieken gebruikt om onderscheid te maken tussen verschillende modellen van hoe soorten, inclusief mensen, evolueerden. Ze ontdekten dat de meeste aanpassingen waar de evolutie de voorkeur aan geeft, niet afhankelijk zijn van de opkomst van gunstige nieuwe mutaties in populaties, maar in plaats daarvan van de uitbreiding van genetische varianten die al bestonden.

De toepassing van diep leren "op deze nieuwe vragen," zei Kern, "levert opwindende resultaten op."

Hype versus hoop voor de nieuwe tool

Natuurlijk zijn er grote kanttekeningen. Ten eerste, als de werkelijke evolutionaire geschiedenis van de mens niet lijkt op de gesimuleerde modellen waarop deze methoden voor diep leren zijn getraind, dan zullen de technieken onjuiste resultaten opleveren. Dat is een probleem dat Kern en anderen hebben geprobeerd aan te pakken, maar er moet nog veel werk worden verzet om meer zekerheid te bieden.

"Ik denk dat AI is overhyped in toepassingen op genomica," zei Joshua Akey, een ecoloog en evolutionair bioloog aan de Princeton University. "Diep leren is een fantastische nieuwe tool, maar het is gewoon een andere methode. Het gaat niet alle mysteries en complicaties oplossen waarover we meer willen leren in de menselijke evolutie. "

Sommige experts zijn zelfs meer sceptisch. "Mijn oordeel is dat de dichtheid en kwaliteit van de gegevens niet ideaal zijn voor veel andere dan doordachte en intelligente niet-kunstmatige analyses," schreef David Pilbeam, een paleontoloog aan de universiteit van Harvard en het Peabody Museum, in een e-mail.

Toch is het, naar de mening van andere paleontologen en genetici, een goede stap voorwaarts, iets dat kan worden gebruikt voor voorspellingen over mogelijke toekomstige fossiele ontdekkingen en verwachte genetische variaties die duizenden jaren geleden bij de mens hadden moeten bestaan. "Ik denk dat deep learning de bevolkingsgenetica echt een boost zal geven," zei Lao.

Hetzelfde kan gelden voor andere velden waarin we toegang hebben tot gegevens, maar niet voor het proces dat deze heeft opgeleverd. Rond dezelfde tijd dat Kern en andere bevolkingsgenetici en evolutionaire biologen simulatie-gebaseerde AI-technieken ontwikkelden om hun vragen te beantwoorden, deden natuurkundigen dit om te achterhalen hoe de vele gegevens die in de Large Hadron Collider en andere deeltjesversnellers werden geproduceerd, te doorzoeken . Geologische onderzoeks- en aardbevingsvoorspellingsmethoden zijn ook begonnen te profiteren van dit soort diepgaande leerbenaderingen.

"Waar dit toe leidt, weet ik echt niet. We zullen het moeten zien, "zei Nick Patterson, een computationeel bioloog aan het Broad Institute of the Massachusetts Institute of Technology en de universiteit van Harvard. "Maar het is altijd goed om nieuwe methoden te zien. We zullen alles gebruiken wat we kunnen als het goed lijkt in het beantwoorden van de vragen die we willen beantwoorden. "

Oorspronkelijke verhaal herdrukt met toestemming van Quanta Magazine, een redactioneel onafhankelijke publicatie van de Simons Foundation wiens missie het is om het publieke inzicht in de wetenschap te vergroten door onderzoeksontwikkelingen en trends in wiskunde en de fysische en levenswetenschappen te behandelen.


Meer Great WIRED Stories