強力な新チャットボットは登場時と同じくらい謎めいた形で消え去る

強力な新チャットボットは登場時と同じくらい謎めいた形で消え去る

「gpt2-chatbot」と呼ばれる謎めいた新しいAIチャットボットが、今週、主要な大規模言語モデルベンチマークサイトであるLMSYS Orgで公開され、注目を集めました。このボットの出所は不明ですが、OpenAIのGPT-4とほぼ同等の機能を持つと多くの人が考えています。これにより、gpt2-chatbotは、世界でもほんの一握りの開発者しか実現できなかった、稀有なAIモデルの一つとなりました。

「誰が作ったのか、どんなものなのか誰も知らないが、少し触ってみたところ、GPT-4とほぼ同じ能力レベルにあるようだ」とペンシルベニア大学ウォートン校で人工知能を研究するイーサン・モリック教授は月曜日のツイートで述べた。

gpt2-chatbot が話題のピークを迎えた矢先、火曜日の午後に姿を消しました。LMSYSのホームページには「gpt2-chatbot は現在ご利用いただけません」という通知が表示されました。その後、LMSYSはツイートで、チャットボットがオフラインになったのは「予想外のアクセス過多」のためだと確認しました。しかし、LMSYSは「今後のリリースにご期待ください」と述べています。

コミュニティの皆様の素晴らしい熱意に感謝します!本当に予想外の出来事でした。

明確にしておきたいことがいくつかあります。

– 当社のポリシーに沿って、過去には複数のモデル開発者と協力して、未リリースのモデル/チェックポイントへのコミュニティ アクセスを提供してきました (例:…)。

— lmsys.org (@lmsysorg) 2024年4月30日

オンラインAIコミュニティは、匿名のgpt2-chatbotに熱狂しています。あるXユーザーは、gpt2-chatbotがモバイルゲーム「Flappy Bird」のほぼ完璧なクローンをコーディングしたと主張しています。別のXユーザーは、国際数学オリンピックの問題を一発で解いたと述べています。Redditの長文スレッドでは、ユーザーたちがgpt2-chatbotの起源について様々な憶測を飛び交い、OpenAI、Google、それともAnthropicのどれが元なのか議論を呼んでいます。これらの主張を裏付ける証拠はありませんが、OpenAIのCEOであるサム・アルトマン氏をはじめとする幹部のツイートが火に油を注いでいます。

私はGPT2に弱い

— サム・アルトマン (@sama) 2024 年 4 月 30 日

gpt-2の場合

— スティーブン・ハイデル (@stevenheidel) 2024 年 4 月 30 日

gpt2-chatbotは以前、LMSYS Orgのウェブサイトで実際に試用することができました。ドロップダウンメニューの「ダイレクトチャット」または「アリーナ(サイドバイサイド)」から利用できました。LMSYS Orgはポリシーブログで、特定のAIモデル開発者は、一般公開前に匿名の未公開モデルをテストできると述べています。そのため、多くの人がgpt2-chatbotは大手AI開発者による匿名モデルだと信じていました。

「念のためご説明いたしますが、弊社のポリシーに従い、複数のモデル開発者と提携し、コミュニティプレビューテストのために新しいモデルを弊社プラットフォームに導入していただいています」と、LMSYS Orgは月曜日のツイートで、gpt2-chatbotに関するスレッドに返信しました。「これらのモデルはあくまでテスト用であり、一般公開されるまでリーダーボードには掲載されません。」

LMSYS OrgとOpenAIはGizmodoのコメント要請にすぐには応じなかった。

Gizmodoによる限定的なテストでは、gpt2-chatbotはAnthropicやOpenAIの主要なAIモデルに匹敵する能力を備えていることが確認されました。gpt2-chatbotは、高度な大規模言語モデルに特有の動作を示し、優れた推論能力と複雑なタスクに対する詳細な計画立案能力を示しました。以下は、gpt2-chatbot(左)とAnthropicのClaude Opusモデル(右)を比較した例です。

指示プロンプト: gpt2-chatbot (左) vs. Claude 3 Opus (右)
指示プロンプト: gpt2-chatbot (左) vs. Claude 3 Opus (右)スクリーンショット: LMSYS Org
推論プロンプト: gpt2-chatbot (左) vs. Claude 3 Opus (右)
推論プロンプト: gpt2-chatbot (左) vs. Claude 3 Opus (右)スクリーンショット: LMSYS Org

ウィスコンシン大学のコンピュータ工学教授は、gpt2-chatbotが他の主要なAIモデルでは実行できないタスクを実行できることを発見しました。ディミトリス・パパイリオプロス教授は、gpt2-chatbotに、いくつかの曖昧なルールを学習する数学の問題を解かせました。AIはこのような質問に答えるのに非常に苦労します。

gpt2-chatbotが他のどのモデルよりも優れているタスクが1つ見つかりましたが、全く役に立ちませんでした。
@Kangwook_LeeによるA+B-1問題での早期かつ急速な上昇 pic.twitter.com/xwOfnB1r03

— ディミトリス・パパイリオプーロス (@DimitrisPapail) 2024 年 4 月 29 日

gpt2-chatbot に関する情報はまだほとんどありません。しかし、このAIモデルの背後には強力なプレイヤーがいることは明らかです。今後数週間のうちに、gpt2-chatbot の作者とその起源が明らかになるでしょう。これは、新しいAIモデルの登場、あるいは新たなAI開発者の登場を示唆しているのかもしれません。

Tagged: