科学者チームが現代と古代のゲノムを組み合わせて新たな「すべての人の系図」を構築した。これは人類の進化と地球規模での拡散に関する今後の研究の基礎となる成果である。
サイエンス誌に掲載された新たな研究によると、現代および古代のヒトゲノム数千個が、一貫性と統一性を兼ね備えた系図に統合された。これは家系図に似ているが、その規模は巨大で、約2,700万人の祖先が含まれており、これまでに作成された人類系図としては最大規模となる。この新しい系図は、人類の進化の研究や、遺伝性疾患に関する医学研究にも活用できる可能性がある。
「私たちは基本的に、人類全体の巨大な家系図、つまり系図を構築しました。これは、今日の人類に見られるあらゆる遺伝的変異を生み出した歴史を可能な限り正確にモデル化したものです」と、ビッグデータ研究所の進化遺伝学者で本研究の共著者であるヤン・ウォン氏はオックスフォード大学の声明で説明した。「この系図により、ゲノムのあらゆる点において、すべての人の遺伝子配列が互いにどのように関連しているかを見ることができます。」
このネットワークは、世界中の人々が互いにどのように関係しているかを示し、共通の祖先、彼らの時代や出身地などを予測します。また、アフリカからの人類の移動や地球上の他の地域への拡散など、人類史における重要な出来事をモデル化します。
研究者たちは長年にわたりヒトゲノムを収集してきましたが、その全体像をより広範かつ包括的な視点から理解することが課題となっています。データ収集方法の相違、複数のデータベースの存在、そしてデータ品質と分析におけるばらつきのため、これらのゲノムの比較は困難でした。さらに問題をさらに複雑にしているのは、各ヒトゲノムには複数の祖先、つまり様々な民族集団や、ネアンデルタール人やデニソワ人といった全く異なる人類集団に由来する遺伝子配列が含まれていることです。これらの祖先は広大な時間スケールにわたって存在しており、これもまた新たな課題となっています。必要なのは、これらの課題に対応できるアルゴリズムであり、研究者たちはまさにそれを達成したと主張しています。
この地図を作成するために、ウォン氏は同僚らと共に「ノンパラメトリック・ツリー記録法」を現代および古代のヒトゲノムに適用した。最古のものは数十万年前に遡る。私はワシントン大学の生物統計学者で、この研究には関わっていないシャロン・ブラウニング氏に連絡を取り、この成果について意見を求めた。
「この論文は主に、遺伝子研究のための優れた新ツールであるtskit(ツリーシーケンスキット)についてです」とブラウニング氏はメールで説明した。「ツリー」と呼ばれるのは、「多数の個体のゲノムの小さな部分を考察し、その系譜を辿っていくと、最終的にミトコンドリアゲノムにおける『ミトコンドリア・イブ』のように、単一の祖先に辿り着くからです」とブラウニング氏は述べた。「その単一の祖先がツリーの根源であり、考察していた個体群はツリーの枝の先端です」。ブラウニング氏によると、ゲノムの異なる部分では、組換え(遺伝物質の交換によって変異が生じる現象)によってツリーの姿が異なり、tskitは「ゲノム配列に沿ったツリーを推測するために用いられる」という。

実際、このアルゴリズムは、遺伝的変異に注目することで、進化の系図における共通祖先の存在場所を予測します。また、ゲノムには地理タグが付けられているため、共通祖先がどこに住んでいたかを予測できます。
「本質的には、私たちは祖先のゲノムを再構築し、それを用いて広大な関係ネットワークを形成しているのです」と、本研究の筆頭著者であり、ビッグデータ研究所の研究員であるアンソニー・ワイルダー・ウォンズ氏はオックスフォード大学の発表で述べています。「こうすることで、これらの祖先がいつ、どこに住んでいたかを推定することができます。私たちのアプローチの強みは、基礎となるデータについてほとんど仮定を置かず、現代と古代の両方のDNAサンプルを組み込むことができることです。」
ブラウニング氏によると、tskitの初期バージョンは有望性を示していたものの、重大な限界があることが判明したという。研究者たちは現在、その限界に対処し、「様々な研究分野に非常に役立つツールを提供している」と彼女は述べた。さらに彼女は、「著者らは、人類の祖先の起源を視覚化するクールなツールなど、いくつかの応用例を提示していますが、その応用範囲は非常に広く、今後、研究者による活発な開発が期待されます」と付け加えた。
ブラウニング氏は、tskitによって推定された樹木には「不確実性の尺度が備わっていない」ため、その結果は仮説を証明するためではなく、新たな仮説を立てるために役立つだろうと警告した。「検証のためには、より専門的な他の手法が必要になるだろう」と彼女は述べた。
今後、研究チームは新たな遺伝情報が到着次第、システムに追加していく予定です。システムは数百万個以上の遺伝子情報に対応できるため、これは問題にならないと予想しています。