De eerste Pangenome-kaart legt de volledige reikwijdte van de menselijke genetische diversiteit vast

De eerste Pangenome-kaart legt de volledige reikwijdte van de menselijke genetische diversiteit vast

Bronknooppunt: 2657783

Zie de eerste versie van het menselijk genoom als een boek. Het menselijk genoom, dat net na de eeuwwisseling werd gepubliceerd, maakte de weg vrij voor transformatieve therapieën. Genbewerking en gentherapieën strijd nu tegen voorheen onbehandelbare ziekten. Door de genetische letters A, T, C en G te vergelijken met die van onze naaste evolutionaire neven, worden de wortels van onze evolutie en intelligentie onthuld.

Maar waar, of wie, verwijst "onze" naar?

Vanwege technologische beperkingen werd het huidige referentiegenoom samengesteld uit stukjes gesequenced DNA van een handvol mensen, voornamelijk van Europese en Afrikaanse afkomst. Hoewel het van onschatbare waarde is voor het opsporen van genetische ziekten, vat het 'boek van de mensheid' nauwelijks de genetische diversiteit van mensen over de hele wereld samen.

Een nieuwe studie gepubliceerd NATUUR zet de eerste stap om het toepassingsgebied te verbreden. Ongeveer tien jaar in de maak, legde de studie de genomen vast van 47 mensen uit Azië, Afrika, Amerika en Europa. De enorme inspanning heeft in totaal 94 genomen gesequenced, één voor elke set chromosomen voor elke persoon.

Het eindresultaat is de eerste versie van het menselijke "pangenoom" - een verzameling genetische gegevens van elk individu die zorgvuldig zijn verzameld in een enkele referentie. In plaats van een boek is de nieuwe datastructuur nu een bibliotheek die de rijke genetische geschiedenis van mensen over de hele wereld vastlegt.

"Dit is alsof je van zwart-wittelevisie naar 1080p gaat", zei Dr. Keolu Fox van de Universiteit van Californië, San Diego, die niet betrokken was bij het onderzoek.

Het onderzoek maakt deel uit van de Menselijk pangenoomreferentieconsortium (HPRC), een ambitieus internationaal project dat in 2019 is gelanceerd om de diversiteit van onze soort vast te leggen in een uitgebreid referentiewoordenboek. Verre van een academische bezigheid, helpt een diverse referentie wetenschappers om genetische verbanden voor ziekten aan te scherpen, ongeacht hun afkomst.

"Het is een uitzonderlijke vooruitgang... Het maakt het beeld van menselijke genetische variatie nauwkeuriger en completer," zei Dr. Mashaal Sohail van de Nationale Autonome Universiteit van Mexico, die niet betrokken was bij het onderzoek.

De zoektocht naar de genetische blauwdruk van de mensheid

De eerste versie van het menselijk genoom was een triomf. Maar met acht procent ontbrekende details bevatte het ook vooringenomenheid.

In genetische studies stemmen wetenschappers vaak het genoom van patiënten af ​​op het referentiegenoom om ziekteverwekkende DNA-varianten op te sporen. Maar vergelijkbaar met het controleren van typefouten met behulp van een woordenboek, lijdt het proces eronder als het woordenboek onvolledig is, of als het slechts één versie van de spelling van een woord bevat (bijvoorbeeld Amerikaanse 'humor' versus Britse 'humor').

Zonder een volledig diverse DNA-atlas is het moeilijk om genen te ontcijferen die verband houden met zeldzame ziekten, vooral wanneer er meerdere genen bij betrokken zijn, of als de antwoorden begraven liggen in complexe DNA-structuren die uniek zijn voor een bepaalde populatie.

Dan is er het probleem van diagnose en therapie. Kanker voorspellers, bij voorbeeld, werkt mogelijk niet zo goed voor mensen van Aziatische en Afrikaanse afkomst, omdat ze zijn ontwikkeld met behulp van een grotendeels Europese genomische referentie.

Wetenschappers zijn zich terdege bewust van deze minpuntjes en voegen al tientallen jaren aan de eerste versie toe, met de meest recente update GRCh38 uitgebracht in 2017. Hoewel de database DNA van 20 mensen bevat, wordt de database gedomineerd door één persoon met een bijdrage van meer dan 70 procent. Vorig jaar nog een groep uitgebracht een kaart die vrijwel het hele menselijke genoom vastlegde, maar slechts één.

Hoewel het een "grote prestatie is, kan geen enkel genoom de genetische diversiteit van onze soort vertegenwoordigen", aldus de auteurs.

Een genetische metrokaart

De nieuwe studie is de eerste stap naar verbreding van de reikwijdte. Het team verzamelde DNA-sequenties van 47 individuen en hun ouders van alle continenten verwachten Antarctica. Omdat elke persoon twee sets chromosomen heeft, hebben ze samen 94 genoomassemblages gesequenced.

Vanwege technologische beperkingen hebben wetenschappers de GRCh3-referentie al lang bijgewerkt met een soort biologische kopieerbewerking: kleine fouten herstellen, hiaten opvullen of nieuwe varianten toevoegen. De meeste nieuwe data zijn korte DNA-sequenties van mensen die afwijken van de referentie. Maar hun korte lengte maakt het moeilijk om de gegevens correct in het referentiegenoom te plaatsen.

Vanwege deze problemen "hebben we misschien meer dan 70 procent van de structurele varianten in traditionele sequentiebepalingsstudies over het hele genoom gemist", schreef het team.

Dankzij een explosie van innovatieve genetische hulpmiddelen in het afgelopen decennium is het nu echter mogelijk om langere DNA-uitlezingen van een individu vast te leggen. Net als het aanpakken van een puzzel van 1,000 stukjes versus een puzzel met slechts 100 stukjes, maken de langere aflezingen het veel gemakkelijker om de stukjes nauwkeurig samen te voegen tot een volledige genomische reeks. Alles bij elkaar heeft de nieuwe studie 119 miljoen basenparen - de basiseenheid van DNA - toegevoegd aan de GRCh38's bestaande database van 3.2 miljard.

De volgende stap was om de gigantische dataset samen te voegen tot een ontcijferbare atlas.

Hier gebruikte het team een ​​slimme grafiekmethode, analoog aan die van een metrokaart met meerdere vertakkingen. Gedeelde genetische sequenties komen samen in een enkele lijn. Bij bepaalde "stops" waar de genetische sequenties verschillen, divergeren ze in afzonderlijke lijnen. Sommige kunnen uiteindelijk weer samenkomen in een andere gezamenlijke lijn van gedeelde sequenties. Over het algemeen maakt de grafiek het relatief eenvoudig om DNA-gebieden die door meerdere mensen worden gedeeld, uit elkaar te halen en die uniek voor elk individu vast te leggen.

Het eindresultaat is de eerste versie van het menselijke pangenoom.

Ontdekking vanuit diversiteit

In een proof of concept bewees het pangenoom zijn waarde met twee studies die gericht waren op genetische regio's die voorheen moeilijk te verkennen waren. Deze stukjes genetisch materiaal, repetitieve DNA-regio's genoemd, lijken frustrerend op elkaar lijkende puzzelstukjes, waardoor het moeilijk is om ze precies in de grotere genomische verzameling te plaatsen.

Toch kunnen ze ook de sleutel zijn voor de ontwikkeling van kiembaancellen en de evolutie van de menselijke soort. Deze regio's liggen kritisch ten grondslag aan een proces dat helpt bij het ontwikkelen van gezond sperma en eieren, maar ze waren voorheen moeilijk te bestuderen. Met behulp van het pangenoom vond een studie grote verschillen in hoe deze gensegmenten tussen individuen dupliceren en in volgorde schudden.

"Het is opwindend om nauwkeurige karakterisering van segmentale duplicaties te zien, omdat gedupliceerde sequenties de evolutie van nieuwe, gespecialiseerde rollen voor een gen kunnen voeden," zei Drs. Brain McStay van de Universiteit van Galway, Ierland, en Hákon Jónsson van deCODE genetics in Reykjavik, IJsland, die niet betrokken waren bij het onderzoek.

Het pangenoom kan ook licht werpen op genomische "donkere materie" die niet wordt weergegeven in de GRCh38-referentie. Door een veel diverser genetisch landschap vast te leggen, kunnen we mogelijk zeldzame maar consequente mutaties vinden die tot ziekten leiden.

Deze studies zijn slechts een voorproefje van wat komen gaat. Het pangenoom wordt vrijgegeven aan wetenschappers als hulpmiddel voor hun eigen studies.

De kaart is nog maar het eerste ontwerp. Maar het team is al op zoek naar uitbreiding van de dataset, met als doel volgend jaar 350 mensen te bereiken. Het consortium breidt zijn samenwerkingen ook actief uit naar andere delen van de wereld die traditioneel ondervertegenwoordigd zijn, zoals delen van het Midden-Oosten en mensen die tot gemarginaliseerde groepen behoren.

Om auteur Dr. Eimear Kenny aan de Icahn School of Medicine op Mount Sinai te bestuderen, zijn transparantie, privacy en ethiek de sleutelwoorden naarmate het project vordert.

"We erkennen dat dit werk voorop loopt in genomisch onderzoek en specifieke kenmerken heeft, waaronder open toegang tot gegevens", zei ze. zei. "[Deze details] rechtvaardigen veel aandacht en de toepassingen kunnen ethische, juridische en sociale kwesties oproepen."

Krediet van het beeld: Darryl Leja/NHGRI

Tijdstempel:

Meer van Hub voor singulariteit