今週、科学誌「Frontiers in Cell and Developmental Biology」に、最も人気のある AI 画像生成ツールの 1 つである Midjourney で作成された偽の画像を特集した研究が掲載されました。
このオープンアクセス論文は、哺乳類の精巣における幹細胞と、細胞における炎症や癌の発生を媒介するシグナル伝達経路との関係を探求している。論文の内容自体は偽りではないようだが、最も驚くべき点は研究内容そのものではなく、ラットの精巣、シグナル伝達経路、そして幹細胞に関する不正確でグロテスクな描写にある。
AIが生成したラットの図には、上半身に「senctolic stem cell(核幹細胞)」とラベル付けされたラット(親切にも正しくラベル付けされている)が描かれている。非常に大きなラットのペニスと思われる部分には「Dissilced(溶解)」というラベルが付けられ、右側には「iollotte sserotgomar cell(イオロット・セロトゴマー細胞)」「dck(ドック)」「Retat(逆行性)」を強調するインセットが配置されている。うーん。
Frontiersの編集者ガイドラインによると、論文は査読プロセスに先立ち、研究公正チームと担当編集者による「初期品質チェック」を受けることになっている。つまり、画像が公開される前に、多くの目によってこの論文がレビューされたことになる。
研究者たちは論文の中で、記事中の画像はMidjourneyによって生成されたと述べている点を高く評価すべきだろう。しかし、Frontiersのポリシーと出版倫理に関するウェブサイトには、「結論を変えない図の誤り」や「図のラベルが誤っている」といった理由がある場合、訂正を提出できると記載されている。AI生成画像は確かにこれらのカテゴリーに該当すると思われる。西安交通大学の研究者で、この研究の共著者であるDingjun Hao氏は、Gizmodoのコメント要請にすぐには応じなかった。
ネズミの画像は、ネズミの性器を切ったことがない人でも、明らかに間違っている。しかし、論文中の他の図は、少なくとも一見したところでは、素人目にも信憑性があるように思えるかもしれない。しかし、生物学の教科書を一度も開いたことがない人でも、よくよく見れば、それぞれの図のラベルが英語とは少し違うことに気づくだろう。これは、画像にAIが生成したテキストが含まれているという明らかな兆候だ。

この記事は、インド国立酪農研究所の動物生殖の専門家によって編集され、ノースウェスタン・メディシンと国立動物栄養生理学研究所の研究者によって査読されました。では、この奇妙な画像はどのようにして掲載されたのでしょうか?Frontiers in Cell and Developmental Biology誌はコメントの要請にすぐには応じませんでした。
OpenAIのテキスト生成ツールChatGPTは、査読者の厳しい目から目を逃れるほどの優れた能力を持っています。ノースウェスタン大学とシカゴ大学の研究者が行った調査によると、人間の専門家はChatGPTで生成された科学論文要旨に32%の確率で騙されたことがわかりました。
したがって、イラストが明らかに科学を装ったナンセンスだからといって、AIエンジンがナンセンスを真実のように偽装する能力を軽視すべきではありません。重要なのは、これらの研究の著者らが警告したように、AI生成論文は科学的誠実性の危機を引き起こす可能性があるということです。そして、その危機はすでにかなり進行しているように思われます。
シカゴ大学のデータサイエンティストでこの研究の共著者であるアレクサンダー・ピアソン氏は当時、「生成テキスト技術は、例えば英語を母国語としない科学者が研究をより広範なコミュニティと共有しやすくなるなど、科学を民主化する大きな可能性を秘めている」と指摘したが、「使用にあたってのベストプラクティスについては慎重に検討することが不可欠だ」とも述べた。

AIの普及に伴い、科学的に正確ではない画像が科学出版物やニュース記事に登場しています。AI画像は簡単に作成でき、視覚的にも魅力的であることが多いのですが、AIは扱いにくく、図やイラストの指示で科学的正確さのニュアンスをすべて伝えるのは当然ながら困難です。
最近の論文は、過去の偽論文とは全く異なるものだ。過去の偽論文には、「鳥って何?」やスタートレックをテーマにした「超高速走行後の急速な遺伝的・発達的形態変化」といったヒット作も含まれる。
査読を通過した論文は、単に面白いだけの場合もあります。また、科学的価値のないいわゆる研究を「ペーパーミル」が大量生産している兆候である場合もあります。2021年、シュプリンガー・ネイチャーはアラビアン・ジャーナル・オブ・ジオサイエンスに掲載された44本の論文を、全くのナンセンスであるとして撤回せざるを得ませんでした。
この場合、研究自体は問題ないかもしれないが、Midjourneyが生成した画像が含まれていることで、研究全体に疑問が生じている。平均的な読者は、ラットが正確にいくつのボールを持っているかを数えることに忙しく、シグナル伝達経路について考えるのが難しいかもしれない。
続き:ChatGPTは科学査読者を騙すほど上手に書いている