Googleは、ChatGPTよりも優れた性能を謳う最新の生成型AIチャットボット「Gemini」をリリースし、その機能を披露する派手なデモ動画も公開しました。Googleの開発者ブログの投稿によると、この動画は編集され、速度調整され、動画で紹介されたものとは異なるプロンプトが使用されていたとのことです。
Google は Gemini デモ動画の説明で、「このデモでは、レイテンシーが削減され、簡潔にするために Gemini の出力が短縮されています」と述べていますが、ここでの編集の全容は説明されていません。
Geminiのリリースは、OpenAIに追いつくよう投資家からのプレッシャーに直面していたGoogleの人工知能チームにとって、大きなマーケティング戦略となりました。Googleの主力AIチャットボットBardは、2023年時点でChatGPTや他のモデルに遅れをとっていたため、GeminiはGoogleがAI会話の最先端に返り咲くための支援を必要としており、その成果は実を結びました。しかし、Geminiのデモ動画は実際の機能を誇張しすぎていたようです。Googleは当初Geminiのリリースを延期しましたが、その理由はサンダー・ピチャイ氏がまだ準備が整っていないと判断したためでした。そして今、その理由が明らかになっています。
デモ動画では、Geminiが音声、動画、ジェスチャーに対応しているように見えましたが、Googleがそれらの回答を得たのはそうした方法ではありませんでした。Googleのブログ記事によると、動画の中でGeminiが回答を得るためには、より慎重で長いテキストと画像によるプロンプトが必要でした。「Geminiを体験」では、AIが動画と音声機能を備えたリアルタイムアシスタントとして反応しているように見えましたが、これは誤解を招くものであり、ユーザーがすぐにこれらの機能を利用できるようになるわけではありません。この動画は、少なくとも来年まではリリースされないGoogle AIの最先端バージョンであるGemini Ultraで撮影された可能性が高いです。
ブルームバーグが指摘するように、GoogleのGeminiがChatGPTよりも優れているという主張も誤解を招くようだ。Googleは、まだ存在しないGeminiのモデル(Ultra、2024年登場)を、OpenAIの旧式モデル(ChatGPT-4、2023年3月登場)と比較した。このベンチマークは、先月リリースされたOpenAIの最先端AIモデルであるChatGPT-4 Turboとは比較にならない。現在利用可能なGoogleのモデルであるGemini Proは、大規模マルチタスク言語理解(Massive Multitask Language Understanding)においてChatGPT-4に勝てず、7%以上の差をつけられている。

水曜日にユーザーが初めてGemini Proを体験した際、多くの人がその体験にGoogleのマーケティングキャンペーンのような華やかさが欠けていると感じました。Gemini Proは「幻覚」を頻繁に起こすようです。これは、チャットボットが自信満々に虚偽の回答をしてしまうよくある問題です。あるユーザーはXに、Gemini Proが2023年のアカデミー賞で主演男優賞の受賞者は誰なのか答えられなかったと投稿しました。別のユーザーは、イスラエルとガザについて質問された際に、Gemini Proが「Googleで検索して」と指示したことに気づきました。