แผนที่ Pangenome ฉบับแรกรวบรวมความหลากหลายทางพันธุกรรมของมนุษย์ไว้อย่างครบถ้วน

แผนที่ Pangenome ฉบับแรกรวบรวมความหลากหลายทางพันธุกรรมของมนุษย์ไว้อย่างครบถ้วน

โหนดต้นทาง: 2657783

ลองนึกถึงร่างแรกของจีโนมมนุษย์ในรูปแบบหนังสือ จีโนมมนุษย์ได้รับการเผยแพร่ในช่วงเปลี่ยนศตวรรษที่ผ่านมา ปูทางไปสู่การบำบัดแบบเปลี่ยนแปลง การตัดต่อยีนและ ยีนบำบัด ตอนนี้ต่อสู้กับโรคที่รักษาไม่ได้ก่อนหน้านี้ การเปรียบเทียบตัวอักษรพันธุกรรม A, T, C และ G กับตัวอักษรญาติวิวัฒนาการที่ใกล้เคียงที่สุดของเราเป็นการเปิดเผยรากเหง้าของวิวัฒนาการและความฉลาดของเรา

แต่ "ของเรา" หมายถึงอะไรหรือใคร

เนื่องจากข้อจำกัดทางเทคโนโลยี จีโนมอ้างอิงในปัจจุบันจึงถูกรวบรวมจากชิ้นส่วนของ DNA ที่จัดลำดับจากกลุ่มคนไม่กี่คน ซึ่งส่วนใหญ่เป็นคนเชื้อสายยุโรปและแอฟริกา แม้จะมีค่ามากสำหรับการตามล่าโรคทางพันธุกรรม แต่ “หนังสือแห่งมนุษยชาติ” แทบจะไม่ได้สรุปความหลากหลายทางพันธุกรรมของผู้คนทั่วโลก

การศึกษาใหม่ ตีพิมพ์ใน ธรรมชาติ กำลังดำเนินการขั้นแรกเพื่อขยายขอบเขต ประมาณหนึ่งทศวรรษในการสร้าง การศึกษาจับจีโนมของคน 47 คนจากเอเชีย แอฟริกา อเมริกา และยุโรป ความพยายามอย่างมากจัดลำดับจีโนมทั้งหมด 94 จีโนม หนึ่งชุดสำหรับโครโมโซมแต่ละชุดสำหรับแต่ละคน

ผลลัพธ์สุดท้ายคือร่างแรกของ "pangenome" ของมนุษย์ ซึ่งเป็นชุดของข้อมูลทางพันธุกรรมจากแต่ละบุคคลที่รวบรวมอย่างระมัดระวังเป็นข้อมูลอ้างอิงเดียว แทนที่จะเป็นหนังสือ ตอนนี้โครงสร้างข้อมูลใหม่กลายเป็นห้องสมุดที่รวบรวมประวัติศาสตร์ทางพันธุกรรมอันยาวนานของมนุษย์ทั่วโลก

“นี่เหมือนกับการเปลี่ยนจากโทรทัศน์ขาวดำเป็น 1080p” กล่าวว่า ดร. Keolu Fox จาก University of California, San Diego ซึ่งไม่ได้มีส่วนร่วมในการศึกษานี้

การศึกษาเป็นส่วนหนึ่งของ กลุ่มอ้างอิง Pangenome มนุษย์ (HPRC) โครงการระหว่างประเทศที่มีความทะเยอทะยานที่เปิดตัวในปี 2019 เพื่อรวบรวมความหลากหลายของสายพันธุ์ของเราไว้ในพจนานุกรมอ้างอิงที่ครอบคลุม ห่างไกลจากการแสวงหาทางวิชาการ การอ้างอิงที่หลากหลายช่วยให้นักวิทยาศาสตร์สามารถฝึกฝนความเชื่อมโยงทางพันธุกรรมของโรคได้ โดยไม่คำนึงถึงบรรพบุรุษ

“มันเป็นความก้าวหน้าที่เหนือชั้น… มันทำให้ภาพความแปรผันทางพันธุกรรมของมนุษย์มีความแม่นยำและสมบูรณ์ยิ่งขึ้น” กล่าวว่า ดร. Mashaal Sohail จาก National Autonomous University of Mexico ซึ่งไม่ได้มีส่วนร่วมในการศึกษานี้

การแสวงหาพิมพ์เขียวพันธุกรรมของมนุษยชาติ

ร่างแรกของจีโนมมนุษย์ถือเป็นชัยชนะ แต่เนื่องจากขาดรายละเอียดไปแปดเปอร์เซ็นต์ จึงมีอคติอยู่ด้วย

ในการศึกษาเกี่ยวกับพันธุกรรม นักวิทยาศาสตร์มักจะจับคู่จีโนมของผู้ป่วยกับจีโนมอ้างอิงเพื่อตามล่าสายพันธุ์ดีเอ็นเอที่ก่อให้เกิดโรค แต่คล้ายกับการตรวจสอบการพิมพ์ผิดโดยใช้พจนานุกรม กระบวนการนี้จะมีปัญหาหากพจนานุกรมไม่สมบูรณ์ หรือหากพจนานุกรมมีการสะกดคำเพียงเวอร์ชันเดียว (เช่น "อารมณ์ขัน" แบบอเมริกันกับ "อารมณ์ขัน" แบบอังกฤษ)

หากไม่มี Atlas DNA ที่หลากหลายอย่างสมบูรณ์ ก็ยากที่จะถอดรหัสยีนที่เชื่อมโยงกับโรคหายาก โดยเฉพาะอย่างยิ่งเมื่อมียีนหลายตัวเกี่ยวข้องกัน หรือหากคำตอบถูกฝังอยู่ในโครงสร้าง DNA ที่ซับซ้อนซึ่งมีเฉพาะในประชากรบางกลุ่ม

จากนั้นก็มีปัญหาในการวินิจฉัยและการรักษา ตัวทำนายมะเร็ง เช่นอาจใช้งานไม่ได้เช่นกันสำหรับมรดกทางเอเชียและแอฟริกา เนื่องจากพวกมันได้รับการพัฒนาโดยใช้การอ้างอิงจีโนมของยุโรปเป็นส่วนใหญ่

นักวิทยาศาสตร์ทราบดีถึงอาการสะอึกเหล่านี้ จึงเพิ่มร่างแรกลงในร่างแรกมานานหลายทศวรรษแล้ว โดยอัปเดตล่าสุด GRCh38 ที่เปิดตัวในปี 2017 แม้ว่าจะมี DNA จากคน 20 คน แต่ฐานข้อมูลกลับถูกควบคุมโดยคนคนเดียวซึ่งมีส่วนร่วมมากกว่า 70 เปอร์เซ็นต์ ปีที่แล้วอีกกลุ่ม การเผยแพร่ แผนที่ที่จับภาพจีโนมมนุษย์ได้ทั้งหมด แต่มีเพียงจีโนมเดียว

แม้ว่าจะเป็น "ความสำเร็จครั้งสำคัญ แต่ไม่มีจีโนมเดียวที่สามารถแสดงถึงความหลากหลายทางพันธุกรรมของสายพันธุ์ของเรา" ผู้เขียนกล่าว

แผนที่รถไฟใต้ดินพันธุกรรม

การศึกษาใหม่เป็นขั้นตอนแรกในการขยายขอบเขต ทีมรวบรวมลำดับดีเอ็นเอจากบุคคล 47 คนและพ่อแม่ของพวกเขาจากทุกทวีปที่คาดว่าแอนตาร์กติกา เนื่องจากแต่ละคนมีโครโมโซมสองชุด พวกเขาจึงจัดลำดับชุดจีโนมได้ 94 ชุด

เนื่องจากข้อจำกัดทางเทคโนโลยี นักวิทยาศาสตร์ได้ปรับปรุงข้อมูลอ้างอิง GRCh3 มาเป็นเวลานานด้วยการแก้ไขสำเนาทางชีวภาพ เช่น แก้ไขข้อผิดพลาดเล็กๆ น้อยๆ เติมช่องว่าง หรือเพิ่มตัวแปรใหม่ ข้อมูลใหม่ส่วนใหญ่เป็นลำดับดีเอ็นเอสั้นๆ จากบุคคลที่แตกต่างจากข้อมูลอ้างอิง แต่ความยาวที่สั้นทำให้ยากต่อการวางข้อมูลลงในจีโนมอ้างอิงอย่างถูกต้อง

เนื่องจากปัญหาเหล่านี้ "เราอาจพลาดมากกว่า 70 เปอร์เซ็นต์ของตัวแปรโครงสร้างในการศึกษาลำดับจีโนมทั้งหมดแบบดั้งเดิม" เขียน ทีมงาน.

เนื่องจากการระเบิดของเครื่องมือทางพันธุศาสตร์ที่เป็นนวัตกรรมใหม่ในช่วงทศวรรษที่ผ่านมา ทำให้สามารถจับ DNA ที่ยาวขึ้นจากแต่ละบุคคลได้ เช่นเดียวกับการไขปริศนาที่มีชิ้นส่วน 1,000 ชิ้นต่อหนึ่งชิ้นที่มีเพียง 100 ชิ้น การอ่านที่ยาวขึ้นจะทำให้การประกอบชิ้นส่วนต่างๆ เข้ากับลำดับจีโนมที่สมบูรณ์และแม่นยำนั้นง่ายขึ้นมาก การศึกษาครั้งใหม่นี้ได้เพิ่มคู่เบส 119 ล้านคู่ซึ่งเป็นหน่วยพื้นฐานของ DNA ลงในฐานข้อมูลที่มีอยู่ของ GRCh38 ที่ 3.2 พันล้าน

ขั้นตอนต่อไปคือการโต้แย้งชุดข้อมูลขนาดมหึมาในแผนที่ที่ถอดรหัสได้

ที่นี่ ทีมงานใช้วิธีกราฟอันชาญฉลาด คล้ายกับแผนที่รถไฟใต้ดินที่มีหลายสาขา ลำดับพันธุกรรมที่ใช้ร่วมกันมาบรรจบกันเป็นบรรทัดเดียว ที่ "จุดหยุด" บางแห่งที่ลำดับพันธุกรรมแตกต่างกัน พวกมันแยกออกเป็นเส้นแยกกัน บางส่วนอาจกลับมาบรรจบกันอีกครั้งในลำดับของลำดับที่ใช้ร่วมกันอีกเส้นหนึ่ง โดยรวมแล้ว กราฟทำให้ง่ายต่อการแยกส่วนต่าง ๆ ของ DNA ที่ใช้ร่วมกันระหว่างคนหลาย ๆ คน และจับส่วนที่ไม่ซ้ำกันของแต่ละคน

ผลลัพธ์ที่ได้คือร่างแรกของ pangenome มนุษย์

การค้นพบจากความหลากหลาย

ในการพิสูจน์แนวคิด pangenome พิสูจน์คุณค่าด้วย สอง การศึกษา ซึ่งมุ่งเน้นไปที่บริเวณพันธุกรรมที่ยากแก่การสำรวจก่อนหน้านี้ เรียกว่าบริเวณ DNA ที่เกิดซ้ำ ชิ้นส่วนของสารพันธุกรรมเหล่านี้เป็นเหมือนชิ้นส่วนปริศนาที่คล้ายกันอย่างน่าผิดหวัง ทำให้ยากต่อการใส่เข้าไปในชุดประกอบจีโนมที่ใหญ่ขึ้นอย่างแม่นยำ

พวกเขายังอาจถือกุญแจสำคัญสำหรับวิศวกรรมเซลล์สืบพันธุ์และวิวัฒนาการของสายพันธุ์มนุษย์ ภูมิภาคเหล่านี้มีความสำคัญอย่างยิ่งต่อกระบวนการที่ช่วยพัฒนาสเปิร์มและไข่ที่แข็งแรง แต่ก่อนหน้านี้ศึกษาได้ยาก จากการใช้ pangenome การศึกษาชิ้นหนึ่งพบความแตกต่างอย่างมากในการที่กลุ่มยีนเหล่านี้ทำซ้ำและสับเปลี่ยนตามลำดับระหว่างบุคคล

“เป็นเรื่องน่าตื่นเต้นที่ได้เห็นการจำแนกลักษณะเฉพาะของการแบ่งส่วนซ้ำอย่างแม่นยำ เพราะลำดับที่ซ้ำกันสามารถกระตุ้นการวิวัฒนาการของบทบาทใหม่เฉพาะสำหรับยีน” กล่าวว่า ดร. Brain McStay จาก University of Galway ประเทศไอร์แลนด์ และ Hákon Jónsson จาก deCODE Genetics ในเมือง Reykjavik ประเทศไอซ์แลนด์ ซึ่งไม่ได้มีส่วนร่วมในการศึกษานี้

pangenome ยังอาจเปิดเผยเกี่ยวกับ "สสารมืด" จีโนมที่ไม่ได้แสดงในการอ้างอิง GRCh38 ด้วยการจับภาพลักษณะทางพันธุกรรมที่หลากหลายมากขึ้น เราอาจพบการกลายพันธุ์ที่หายากแต่เป็นผลสืบเนื่องที่นำไปสู่โรคต่างๆ

การศึกษาเหล่านี้เป็นเพียงการลองชิมสิ่งที่จะเกิดขึ้น pangenome ถูกปล่อยให้นักวิทยาศาสตร์เป็นแหล่งข้อมูลเพื่อใช้ในการศึกษาของพวกเขาเอง

แผนที่เป็นเพียงร่างแรก แต่ทีมกำลังมองหาที่จะขยายชุดข้อมูลโดยมีเป้าหมายที่จะเข้าถึง 350 คนภายในปีหน้า สมาคมนี้ยังขยายความร่วมมืออย่างแข็งขันไปยังส่วนอื่น ๆ ของโลกซึ่งแต่เดิมมีบทบาทน้อย เช่น บางส่วนของตะวันออกกลางและผู้คนที่อยู่ในกลุ่มชายขอบ

เพื่อศึกษาผู้เขียน Dr. Eimear Kenny จาก Icahn School of Medicine ที่ Mount Sinai ในขณะที่โครงการก้าวไปข้างหน้า ความโปร่งใส ความเป็นส่วนตัว และจริยธรรมเป็นกุญแจสำคัญ

“เราทราบดีว่างานนี้อยู่ในระดับแนวหน้าของการวิจัยจีโนมและมีคุณสมบัติเฉพาะ รวมถึงการเข้าถึงข้อมูลแบบเปิด” เธอ กล่าวว่า. “[รายละเอียดเหล่านี้] รับประกันการพิจารณาอย่างมาก และการยื่นคำร้องสามารถหยิบยกประเด็นด้านจริยธรรม กฎหมาย และสังคมได้”

เครดิตภาพ: ดาร์ริล เลจา/NHGRI

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์