生身の人間の顔と人工知能によって生成された顔を区別するのは難しい場合があります。(眼鏡をかけている時の歪んだ目、皮膚科的ではない傷、頭頂部のわらで覆われたような髪などは、その兆候ですが、人によって感じ方は異なるかもしれません。)しかし、偽物が皮膚の奥深くまで及んでいる場合はどうでしょうか。コンピューターによって生成された人間が遺伝子レベルで表現されているとしたらどうでしょうか?
PLOS Genetics誌に掲載された論文によると、遺伝学者とコンピュータ科学者からなるチームがニューラルネットワークを用いてヒトゲノムの新たな断片を構築した。この研究は、実在の人物のDNAを扱う際に生じるプライバシーの問題を回避するのに役立つ可能性がある。
「エストニア・バイオバンクを含む多くのバイオバンクは、アクセスに申請手続きと倫理的承認を必要とします。ゲノムデータは機密データであり、提供者のプライバシーを守ることが重要であるため、これらの手順は極めて重要です。しかし一方で、これは科学的な障壁を生み出します」と、エストニアのタルトゥ大学の遺伝学者で、今回の論文の筆頭著者であるブラク・イェルメン氏はメールで述べています。「人工ゲノムは、現実のゲノムデータベースの高品質な代替物として、世界中の研究者が容易にアクセスできるようにすることで、将来的に重要な役割を果たす可能性があります。」
https://[削除されたリンク]/another-realistic-deepfake-app-goes-viral-before-majorl-1837816379
遺伝子データは、私たちを定義する遺伝子の力ゆえに、医療プライバシーにおける倫理的問題の中でもおそらく最大の地雷原と言えるでしょう。研究チームは、アクセス可能な(つまり合法的に入手可能な)遺伝子情報を用いてネットワークを訓練しました。ネットワークは、実際の遺伝子情報とほぼ区別がつかない架空のゲノムデータを独自に生成することができました。イェルメン氏によると、人工DNAデータの組み立て方法など、いくつかのヒントがありました。最終製品における位置がわかるように、遺伝子情報の異なる断片は色分け、つまり「ペイント」されていました。そして研究チームは、実際のヒトゲノムサンプルに基づいて予想されるよりも多くの短い人工DNAデータが生成されていることを発見しました。
研究チームは計算とアルゴリズムの制限により人工ゲノム全体を生成することはできなかったが、複数の断片を「つなぎ合わせて」架空の個体の完全なゲノム情報を得ることを提案した。
「ここでのボトルネックはモデルのトレーニングです。一度モデルをトレーニングすれば、数秒で好きなだけ人工ゲノムを生成できます」とイェルマン氏は述べた。「1万ポジションのゲノムチャンクのトレーニングは、複数の要因によって劇的に変化する可能性があります。」イェルマン氏によると、遺伝子コード内の特定の場所に出現するヌクレオチド塩基対の位置を示すポジションが非常に多いため、モデルがランダム性から正確な結果を生成するのが困難な場合があるという。

本研究で用いられたディープラーニングには、2つの異なるアプローチが用いられました。1つは生成的敵対的ネットワークで、2つのニューラルネットワークを用いて学習を行います。1つ目(「ジェネレーター」)は、モデルが学習できる可能性のあるインスタンス、つまりデータセットを作成します。この場合、データセットはランダムに生成された遺伝子コードの行です。もう1つのネットワークは「ディスクリミネーター」で、前者の妥当性を評価します。この出力はジェネレーターにフィードバックされ、その後の試行の精度向上に役立ちます。もう1つのアプローチは制限付きボルツマンマシンで、これは2層ニューラルネットワークで、時間の経過とともに構造を学習し、より良い結果を生み出すのに役立ちます。ディープラーニングでは、ほとんどの場合、生成的敵対的ネットワークが好まれています。
イェルメン氏によると、チームの生成的敵対ネットワークは、1つのGPU(グラフィック・プロセッシング・ユニット)を使って完全に学習するのに数日かかったという。GPUは、精緻な3Dレンダリングからディープラーニングまで、様々なタスクに使用される高負荷プロセッサである。
https://gizmodo.com/are-our-terrible-genetic-privacy-laws-hurting-science-1795513720
「ランダムノイズから生成されたこれらのゲノムは、現実の人類集団で観察される複雑性を模倣しています」と、同じくタルトゥ大学の遺伝学者で共著者のルカ・パガーニ氏は、エストニア研究評議会の発表で述べています。「ほとんどの特性において、これらのゲノムは、アルゴリズムの訓練に使用したバイオバンクの他のゲノムと区別できません。ただ一つだけ例外があります。それは、これらのゲノムがどの遺伝子提供者にも属していないということです。」
原文を明かすことなく、常に再構成され、完璧に読める新しい物語へと昇華していく本を想像してみてください。ファクシミリゲノムは、将来の研究にそのような可能性をもたらし、個人の遺伝子コードが危険にさらされる心配もありません。