初のパンゲノムマップは人類の遺伝的多様性の全範囲を捉えている

初のパンゲノムマップは人類の遺伝的多様性の全範囲を捉えている

ソースノード: 2657783

ヒトゲノムの最初の草案を本として考えてみましょう。 今世紀の変わり目を過ぎた頃に発表されたヒトゲノムは、革新的な治療法への道を切り開きました。 遺伝子編集と 遺伝子治療 今では以前は治療できなかった病気と闘っています。 A、T、C、G の遺伝文字を、私たちに最も近い進化上の親戚の遺伝子文字と比較することで、私たちの進化と知性のルーツが明らかになります。

しかし、「私たち」とは何を、あるいは誰を指すのでしょうか?

技術的な制約により、現在の参照ゲノムは、主にヨーロッパ系とアフリカ系の少数の人々から配列決定された DNA の塊から組み立てられました。 「人類の書」は、遺伝病を突き止めるのに非常に貴重ではありますが、世界中の人々の遺伝的多様性を要約しているわけではありません。

新しい研究 に発表され 自然 はその範囲を広げる第一歩を踏み出しています。 約47年の歳月をかけて、この研究はアジア、アフリカ、南北アメリカ、ヨーロッパの94人のゲノムを取得した。 この大変な努力により、各人の染色体セットごとに XNUMX つずつ、合計 XNUMX 個のゲノムの配列が決定されました。

最終的な結果は、ヒト「パンゲノム」の最初の草案です。これは、各個人からの遺伝データの集合体であり、単一の参考資料に注意深く編集されます。 新しいデータ構造は書籍ではなく、世界中の人類の豊かな遺伝史を記録したライブラリになりました。

「これは白黒テレビから 1080p に移行するようなものです。」 カリフォルニア大学サンディエゴ校のケオル・フォックス博士は、この研究には関与していませんでした。

この研究は、 ヒトパンゲノムリファレンスコンソーシアム (HPRC) は、私たちの種の多様性を包括的な参照辞書にまとめるために 2019 年に立ち上げられた野心的な国際プロジェクトです。 学術的な追求とは程遠い、多様な参考資料は、科学者が祖先を問わず病気の遺伝的関連に焦点を当てるのに役立ちます。

「これは並外れた進歩です…人間の遺伝的変異の全体像をより正確かつ完全なものにしています。」 メキシコ国立自治大学のマシャール・ソハイル博士は、この研究には関与していなかった。

人類の遺伝子設計図の探求

ヒトゲノムの最初の草案は勝利でした。 しかし、詳細の XNUMX% が​​欠けており、偏見も含まれていました。

遺伝子研究では、科学者は病気の原因となる DNA 変異を突き止めるために、患者のゲノムを参照ゲノムと照合することがよくあります。 しかし、辞書を使用してタイプミスをチェックするのと同様に、辞書が不完全な場合、または単語のスペルが XNUMX つのバージョンしか含まれていない場合(たとえば、アメリカの「ユーモア」とイギリスの「ユーモア」)、このプロセスは困難になります。

完全に多様な DNA アトラスがなければ、希少疾患に関連する遺伝子を解読することは困難です。特に複数の遺伝子が関与している場合、またはその答えが特定の集団に特有の複雑な DNA 構造の中に埋もれている場合には困難です。

次に、診断と治療の問題があります。 がんの予測因子、 例えばは、主にヨーロッパのゲノム参照を使用して開発されているため、アジアおよびアフリカの伝統を持つ人々にはうまく機能しない可能性があります。

こうした問題をよく認識している科学者たちは、何十年にもわたって最初の草案に追加を続け、38 年にリリースされた最新のアップデート GRCh2017 をリリースしました。データベースには 20 人からの DNA が含まれていますが、データベースは 70% 以上の貢献を持つ XNUMX 人の人物によって支配されています。 去年は別のグループで リリース ヒトゲノムの全体を仮想的に捉えた地図ですが、それは XNUMX つだけです。

「大きな成果ではあるが、単一のゲノムで私たちの種の遺伝的多様性を表すことはできない」と著​​者らは述べた。

遺伝的な地下鉄路線図

新しい研究は、範囲を広げるための第一歩です。 研究チームは、南極を除くすべての大陸に住む47人の個体とその両親からDNA配列を集計した。 各人は 94 セットの染色体を持っているため、合計 XNUMX 個のゲノム アセンブリの配列が決定されました。

技術的な制約のため、科学者たちは長い間、小さなエラーを修正したり、ギャップを埋めたり、新しいバリアントを追加したりする、一種の生物学的コピー編集によって GRCh3 リファレンスを更新してきました。 新しいデータのほとんどは、参照データとは異なる人々の短い DNA 配列です。 しかし、その長さが短いため、データを参照ゲノムに正しく配置することが困難になります。

これらの問題により、「従来の全ゲノム配列研究では構造的変異の 70% 以上を見逃していた可能性があります。」 書いた チーム。

しかし、過去 1,000 年間で革新的な遺伝ツールが爆発的に普及したおかげで、現在では個人からより長い DNA 読み取りを取得できるようになりました。 100 ピースのパズルに取り組むのと、わずか 119 ピースのパズルに取り組むのと同じように、リードが長いほど、ピースを正確に完全なゲノム配列に組み立てることがはるかに簡単になります。 新しい研究を合わせると、GRCh38 の既存の 3.2 億データベースに、DNA の基本単位である XNUMX 億 XNUMX 万塩基対が追加されました。

次のステップは、膨大なデータセットを解読可能なアトラスにまとめることでした。

ここでチームは、複数の分岐がある地下鉄路線図に似た、巧妙なグラフ手法を使用しました。 共有された遺伝子配列は XNUMX つの系統に収束します。 遺伝子配列が異なる特定の「停止点」で、それらは別個の系統に分岐します。 一部は、最終的には共有シーケンスの別の結合ラインに再収束する可能性があります。 全体として、グラフを使用すると、複数の人々に共有される DNA の領域を分解し、各個人に固有の DNA 領域をキャプチャすることが比較的簡単になります。

最終的な結果は、ヒトパンゲノムの最初の草案です。

多様性からの発見

概念実証では、パンゲノムの価値が証明されました。 2 研究 これまで探索が困難だった遺伝子領域に焦点を当てました。 反復 DNA 領域と呼ばれるこれらの遺伝物質の塊は、もどかしいほど似たパズルのピースのようなもので、より大きなゲノム集合体に正確に組み込むことが困難です。

しかし、それらは生殖細胞系列の細胞工学と人類の進化の鍵を握っている可能性もあります。 これらの領域は、健康な精子と卵子の発達を助けるプロセスの重要な基盤となっていますが、以前は研究が困難でした。 パンゲノムを使用したある研究では、これらの遺伝子セグメントがどのように複製され、順序がシャッフルされるかについて個人間で大きな違いがあることがわかりました。

「分節重複の正確な特徴付けを見るのは興味深いことです。重複した配列は、遺伝子の新しい特殊な役割の進化を促進する可能性があるためです。」 博士たち。 アイルランドのゴールウェイ大学の Brain McStay 氏と、アイスランドのレイキャビクにある deCODE Genetics の Hákon Jónsson 氏は、この研究には関与していませんでした。

パンゲノムは、GRCh38 文献では示されていないゲノムの「暗黒物質」にも光を当てる可能性があります。 はるかに多様な遺伝的状況を捉えることで、まれではあるが病気につながる重大な突然変異を発見できるかもしれません。

これらの研究は、今後何が起こるかを試してみるだけです。 パンゲノムは、科学者自身の研究に使用するためのリソースとして科学者に公開されます。

この地図はまだ初稿にすぎません。 しかしチームはすでにデータセットの拡大を検討しており、来年までに350人に到達することを目標にしている。 このコンソーシアムはまた、中東の一部や疎外さ​​れたグループに属する人々など、伝統的に過小評価されてきた世界の他の地域にも積極的に協力を拡大しています。

マウント・サイナイのアイカーン医科大学で著者のアイメア・ケニー博士を研究するには、プロジェクトを進める上で、透明性、プライバシー、倫理が鍵となります。

「私たちは、この研究がゲノム研究の最前線にあり、データのオープンアクセスなどの特別な特徴があることを認識しています。」と彼女は述べた。 。 「(これらの詳細は)十分な検討が必要であり、申請は倫理的、法的、社会的な問題を引き起こす可能性がある。」

画像のクレジット: ダリル・レジャ/NHGRI

タイムスタンプ:

より多くの 特異点ハブ