La prima mappa del pangenoma cattura l'intera portata della diversità genetica umana

La prima mappa del pangenoma cattura l'intera portata della diversità genetica umana

Nodo di origine: 2657783

Pensa alla prima bozza del genoma umano come a un libro. Pubblicato poco dopo la fine del secolo, il genoma umano ha aperto la strada a terapie trasformative. Editing genetico e terapie geniche ora combattono malattie precedentemente incurabili. Confrontare le lettere genetiche A, T, C e G con quelle dei nostri cugini evolutivi più prossimi sta svelando le radici della nostra evoluzione e intelligenza.

Ma a cosa oa chi si riferisce "nostro"?

A causa di vincoli tecnologici, l'attuale genoma di riferimento è stato assemblato da pezzi di DNA sequenziato da una manciata di persone, per lo più di origine europea e africana. Sebbene abbia un valore inestimabile per la caccia alle malattie genetiche, il "libro dell'umanità" difficilmente racchiude la diversità genetica delle persone in tutto il mondo.

Un nuovo studio pubblicato nella Natura sta compiendo il primo passo per ampliarne la portata. Dopo circa un decennio di lavoro, lo studio ha catturato i genomi di 47 persone provenienti da Asia, Africa, Americhe ed Europa. Lo sforzo erculeo ha sequenziato un totale di 94 genomi, uno per ogni serie di cromosomi per ogni persona.

Il risultato finale è la prima bozza del "pangenoma" umano, una raccolta di dati genetici di ciascun individuo accuratamente compilati in un unico riferimento. Piuttosto che un libro, la nuova struttura dati è ora una biblioteca, che cattura la ricca storia genetica degli esseri umani in tutto il mondo.

"È come passare dalla televisione in bianco e nero a 1080p", disse Dr. Keolu Fox dell'Università della California, San Diego, che non è stato coinvolto nello studio.

Lo studio è parte del Consorzio di riferimento per il pangenoma umano (HPRC), un ambizioso progetto internazionale lanciato nel 2019 per catturare la diversità della nostra specie in un dizionario di riferimento completo. Lungi dall'essere una ricerca accademica, un riferimento diverso aiuta gli scienziati a perfezionare i collegamenti genetici per le malattie, indipendentemente dall'ascendenza.

"È un progresso eccezionale... Sta rendendo il quadro della variazione genetica umana più accurato e più completo", disse Dr. Mashaal Sohail dell'Università Nazionale Autonoma del Messico, che non è stato coinvolto nello studio.

Il progetto genetico di The Quest for Humanity

La prima bozza del genoma umano fu un trionfo. Ma con l'otto percento dei dettagli mancanti, conteneva anche pregiudizi.

Negli studi genetici, gli scienziati spesso abbinano i genomi dei pazienti al genoma di riferimento per dare la caccia alle varianti del DNA che causano malattie. Ma analogamente al controllo degli errori di battitura utilizzando un dizionario, il processo ne risente se il dizionario è incompleto o se contiene solo una versione dell'ortografia di una parola (ad esempio, "umorismo" americano contro "umorismo" britannico).

Senza un atlante del DNA completamente diversificato, è difficile decifrare i geni collegati a malattie rare, specialmente quando sono coinvolti più geni o se le risposte sono sepolte all'interno di complesse strutture del DNA uniche per una determinata popolazione.

Poi c'è il problema della diagnosi e della terapia. predittori di cancro, per esempio, potrebbero non funzionare altrettanto bene per quelli di origine asiatica e africana, perché sono stati sviluppati utilizzando un riferimento genomico in gran parte europeo.

Ben consapevoli di questi intoppi, gli scienziati hanno aggiunto alla prima bozza per decenni, con l'ultimo aggiornamento GRCh38 rilasciato nel 2017. Sebbene contenga il DNA di 20 persone, il database è dominato da una persona con un contributo superiore al 70%. L'anno scorso, un altro gruppo rilasciato una mappa che ha virtualmente catturato l'intero genoma umano, ma solo uno.

Sebbene sia un "risultato importante, nessun singolo genoma può rappresentare la diversità genetica della nostra specie", hanno detto gli autori.

Una mappa genetica della metropolitana

Il nuovo studio è il primo passo per ampliare il campo di applicazione. Il team ha aggregato sequenze di DNA di 47 individui e dei loro genitori provenienti da tutti i continenti, ad eccezione dell'Antartide. Poiché ogni persona ha due set di cromosomi, tutti insieme hanno sequenziato 94 gruppi di genomi.

A causa di vincoli tecnologici, gli scienziati hanno da tempo aggiornato il riferimento GRCh3 con una sorta di copy-editing biologico: correggendo piccoli errori, colmando lacune o aggiungendo nuove varianti. La maggior parte dei nuovi dati sono brevi sequenze di DNA di persone che differiscono dal riferimento. Ma la loro breve lunghezza rende difficile posizionare correttamente i dati nel genoma di riferimento.

A causa di questi problemi, "potremmo aver perso più del 70 percento delle varianti strutturali negli studi tradizionali di sequenziamento dell'intero genoma", ha scritto Il gruppo.

Grazie all'esplosione di strumenti genetici innovativi nell'ultimo decennio, tuttavia, è ora possibile acquisire letture del DNA più lunghe da un individuo. Come affrontare un puzzle da 1,000 pezzi rispetto a uno con soli 100 pezzi, le letture più lunghe rendono molto più facile assemblare i pezzi in una sequenza genomica completa con precisione. Complessivamente, il nuovo studio ha aggiunto 119 milioni di paia di basi, l'unità di base del DNA, al database esistente di GRCh38 di 3.2 miliardi.

Il passo successivo è stato trasformare l'enorme set di dati in un atlante decifrabile.

Qui, il team ha utilizzato un metodo grafico intelligente, analogo a quello di una mappa della metropolitana con più diramazioni. Le sequenze genetiche condivise convergono in un'unica linea. A determinate "fermate" in cui le sequenze genetiche differiscono, divergono in linee separate. Alcuni possono eventualmente riconvergere in un'altra linea congiunta di sequenze condivise. Nel complesso, il grafico rende relativamente facile separare aree di DNA condivise da più persone e catturare quelle uniche per ogni individuo.

Il risultato finale è la prima bozza del pangenoma umano.

Scoperta dalla diversità

In una prova di concetto, il pangenoma ha dimostrato il suo valore con seconda studi che si concentrava su regioni genetiche precedentemente difficili da esplorare. Chiamate regioni ripetitive del DNA, questi pezzi di materiale genetico sono come pezzi di un puzzle frustrantemente simili, rendendo difficile inserirli con precisione nel più ampio assemblaggio genomico.

Eppure possono anche contenere la chiave per l'ingegneria delle cellule germinali e l'evoluzione della specie umana. Queste regioni sono alla base di un processo che aiuta a sviluppare spermatozoi e ovuli sani, ma in precedenza erano difficili da studiare. Usando il pangenoma, uno studio ha trovato grandi differenze nel modo in cui questi segmenti genici si duplicano e si rimescolano in ordine tra gli individui.

"È emozionante vedere un'accurata caratterizzazione delle duplicazioni segmentali, perché le sequenze duplicate possono alimentare l'evoluzione di nuovi ruoli specializzati per un gene", disse Dott. Brain McStay dell'Università di Galway, in Irlanda, e Hákon Jónsson della deCODE genetics di Reykjavik, in Islanda, che non erano coinvolti nello studio.

Il pangenoma può anche far luce sulla "materia oscura" genomica non rappresentata nel riferimento GRCh38. Catturando un panorama genetico molto più diversificato, potremmo essere in grado di trovare mutazioni rare ma consequenziali che portano a malattie.

Questi studi sono solo un assaggio di ciò che verrà. Il pangenoma viene rilasciato agli scienziati come risorsa da utilizzare nei propri studi.

La mappa è solo la prima bozza. Ma il team sta già cercando di espandere il set di dati, con l'obiettivo di raggiungere 350 persone entro il prossimo anno. Il consorzio sta anche espandendo attivamente le sue collaborazioni ad altre parti del mondo tradizionalmente sottorappresentate, come parti del Medio Oriente e persone appartenenti a gruppi emarginati.

Per studiare l'autore Dr. Eimear Kenny presso la Icahn School of Medicine del Mount Sinai, mentre il progetto va avanti, la trasparenza, la privacy e l'etica sono fondamentali.

"Riconosciamo che questo lavoro è in prima linea nella ricerca genomica e ha caratteristiche specifiche, incluso l'accesso aperto ai dati", ha affermato. disse. "[Questi dettagli] meritano molta considerazione e che le applicazioni possono sollevare questioni etiche, legali e sociali".

Immagine di credito: Darryl Leja/NHGRI

Timestamp:

Di più da Hub di singolarità