GoogleがChatGPTよりもはるかに優れていると評価するAI「Gemini」

GoogleがChatGPTよりもはるかに優れていると評価するAI「Gemini」

Googleは水曜日に新しいAIモデル「Gemini」を発表し、テクノロジー系メディアを騒がせていた技術を初めて一般公開しました。同社史上最強のAIであるGeminiは、本日からBardおよびPixel 8 Proスマートフォンに搭載され、まもなくChrome、検索、広告など、Googleのサービス全体と連携する予定です。Googleがユーザーに伝えたいメッセージは、このAIはOpenAIが提供するものよりもはるかに優れているということです。

「この新しい時代のモデルは、私たちが企業として取り組んできた科学技術における最大の取り組みの一つです」と、GoogleのCEOであるサンダー・ピチャイ氏は声明で述べた。「今後の展開、そしてジェミニが世界中の人々にもたらすであろう機会に、心から期待しています。」

約1年前、OpenAIはChatGPTを世界に公開しました。これにより、Googleをはじめとする企業は、自社のツールがChatGPTと同等の先進性を持っていることを証明しようと躍起になっています。今のところ、GoogleのチャットボットBardはChatGPTに比べると見劣りします。しかし、Googleは、この状況は今から変わると宣言しています。Bardは、ほとんどの人にとってGeminiを初めて体験することになるかもしれませんが、リリース時にはモデルの完全な機能が搭載されるわけではありません。

新しい吟遊詩人に会う

Geminiには3つのレベルがあります。Gemini UltraはGoogleの最も強力なモデルで、OpenAIのGPT-4の競合として位置付けられています。Gemini Proは、ChatGPTのベースラインバージョンであるGPT-3.5を上回る性能を持つミッドレンジモデルです。そして最後は、モバイルデバイスで動作するように設計された、より効率的なモデルであるGemini Nanoです。

水曜日の時点で、Bardは「Gemini Proの微調整版」で動作していると、GoogleアシスタントとBard担当バイスプレジデントのシシー・シャオ氏は記者会見で述べた。「より高度な推論、計画、理解、その他の機能を備えています。」

シャオ氏によると、グーグルはジェミニ・ウルトラで稼働するチャットボットの有料版を来年初めにリリースする予定で、同社は「Bard Advanced」と呼んでいる。価格に関する詳細は明らかにしなかった。

Googleは、ほぼすべての指標において新しいBardがChatGPTの無料版を凌駕することを示すベンチマークテストの長いリストを公開しました。同社は、YouTuberのマーク・ローバーとのコラボレーションによる、Bardが超高精度の紙飛行機を作るデモなど、Bardの強化された新機能のデモをいくつか公開しました。

Bardに加え、Geminiも水曜日のアップデートでAndroidスマートフォンPixel 8 Proに搭載されますが、機能は限定的です。Gemini Nanoは現在、Pixel 8 ProのAndroidレコーダーアプリの要約機能に搭載されています。Googleによると、このAIはPixel 8 ProのAndroidスマートリプライ機能にも搭載されますが、Googleキーボードを使用している場合のみ、かつWhatsAppでのみ利用可能です。同社は、Geminiが来年、より多くのメッセージングアプリやOSの他の部分にも搭載される予定だと発表しています。

GoogleはGeminiがGPT-4より優れていると述べている

現時点では、GPT-4が一般に公開されている最も強力なモデルです。GoogleはGPT-4に勝ったと発表しており、Gemini Ultraがリリースされれば市場で最高のAIになるでしょう。

「Geminiは90%を超えるスコアを獲得し、業界標準のベンチマークであるMMLUにおいて人間の専門家を上回った初のAIモデルです」と、Google DeepMindのプロダクト担当バイスプレジデント、イーライ・コリンズ氏は述べています。「これは当社最大かつ最も有能なAIモデルです。」MMLU(Massive Multitask Language Understanding)は、数学、物理学、歴史、法律、医学、倫理など57科目を組み合わせた標準テストを用いてAIの能力を測定します。

Googleは、Gemini UltraとGPT-4の性能を複数のテストで比較したグラフを公開しました。ほぼすべてのカテゴリーでGoogleがトップです。
Googleは、Gemini UltraとGPT-4の性能を複数のテストで比較したグラフを公開した。ほぼすべてのカテゴリーでGoogleがトップに立っている。画像:Google

しかし、一般の人々がいつその証拠を目にすることができるかは不明だ。先週、The Informationは、GoogleがGeminiのローンチを延期した理由について、AIが「一部の英語以外のクエリを確実に処理できなかった」と報じた。今週予定されていたGoogleのGeminiの対面デモは、無期限に延期された。外国語対応の問題に関する質問に対し、コリンズ氏は「Geminiは、実際には多言語対応に関してはかなり高性能です」と答えた。Googleは、Gemini Ultraが「来年初め」に利用可能になるという以外に具体的な情報は明かさなかった。

「ジェミニのパフォーマンスは、業界で広く使用されている32のベンチマークのうち30で、現在の最先端の結果を上回っています」とコリンズ氏は述べた。

Googleは、Geminiが「マルチモーダルパフォーマンス」を実現するように設計されており、テキスト、画像、動画、音声など、さまざまな種類の情報を理解できることを強調しました。Googleは、Geminiを搭載したBardが、手書きの質問が書かれた課題の写真から生徒の物理の宿題を手伝う動画を公開しました。その後、AIはシームレスに、方程式とステップバイステップの解答を含む書面によるアドバイスへと移行します。

11月、ロイター通信はOpenAIが「Q-Star」または「Q*」と呼ばれる秘密のモデルを用いて、「人工汎用知能」(AGI)(人間よりも賢いAIを指す業界用語)の実現に向けて進歩を遂げたと報じました。報道によると、Q*は基本的な数学の問題に解答する能力を示したとのことですが、これは想像以上に重要な意味を持ちます。なぜなら、法学修士(LLM)は正解が一つしかない問題を扱う訓練を受けていないからです。数学の能力は、高度な推論能力を示すものと言えるでしょう。

Googleはジェミニの数学と物理学の性能を繰り返し強調しましたが、記者会見ではAGIについては触れられませんでした。Gizmodoは、ジェミニの数学性能がAGIの進歩を示唆しているかどうかを尋ねました。

「OpenAIの取り組みの詳細は見ていないので、それについてはあまり言及できません」とコリンズ氏は述べた。「しかし、プレゼンテーションによると、マルチモーダル推論と数学における高度な推論において大きな進歩を遂げています。」

Tagged: