Google、「ディープリサーチ」を搭載した高速化Gemini 2.0をリリース

Google、「ディープリサーチ」を搭載した高速化Gemini 2.0をリリース

AIの新時代へようこそ。ちょっと待ってください、もしかしたら私たちは既に人工知能の恩恵を受けていると思っているのでしょうか?少なくともGoogleによれば、そうでもあり、そうでもありません。Geminiを支えるテクノロジーの巨人が、Gemini 2.0を発表する準備を整えています。Googleによると、この新バージョンでは、エージェントが「エージェント型」AIによって、ユーザーに代わってスマートフォンやデバイス、そしてすべてのアプリを操作するようになるとのことです。

昨年12月に導入された最初のGemini(AndroidとiPhone版Gemini 1.5が登​​場するまでには数ヶ月かかりましたが)と比べて、2.0が完全なアップグレードと言えるのはなぜでしょうか?まず、ユーザーの指示に基づいてより速く応答できるようになるはずです。Gemini 1.5は、同社のImagen 3モデルを使用してAI画像を生成できますが、新バージョンではAI音声出力も可能になります。Googleによると、2.0の最も重要な点は、AIエージェント向けに作られている点です。

この流行語を初めて耳にする方のために、エージェント、あるいは「エージェント化」とは、複数のAIモデルが相互に通信する仕組みだと考えてみてください。AIがあなたのリクエストに応じて電話を操作できるようになる、という考え方です。AIにメールをチェックしてもらい、予約日時を割り出してもらい、カレンダーに登録してもらうといったことがあれば、AIエージェントならきっと対応できるはずです。

Googleが「ユニバーサルアシスタント」と呼ぶこの機能は、Gemini 2.0 Flashから利用可能になり、水曜日からすべてのGeminiユーザーに提供される予定です。Gemini Advancedをお持ちの場合は、「Deep Research」と呼ばれる新しいツールが利用できます。これは、インターネットでのリサーチをすべて代行し、長文の読書レポートを作成するAIエージェントです。Googleのツールは、ユーザーが「自分でリサーチ」して数分でレポートを作成できるようにするとされています。どれだけの学生がこれらのレポートを自分の作品として提出しようとするのか、今後の動向に注目です。

Deep Researchは技術的にはエージェントですが、Googleによると、より多くの開発者が自社アプリでエージェントAIを動作させる取り組みを進めているとのこと。カリフォルニア州マウンテンビューに拠点を置く同社は、Gemini 2.0ベースのエージェントAIがコードをリアルタイムで作成、評価、マージ、実行する様子を実演しました。これは、Microsoftが現在開発中のGitHub Copilotに似た新しい「Jules」ツールです。

同社はまた、Gemini 2.0が「クラッシュ・オブ・クラン」などのSupercell製モバイルゲームと連携する動画も公開しました。AIは画面を読み取って、「スクワッドバスターズ」の現在のメタに関するアドバイスを提供したり、デイリーチャレンジを完了してゲーム内通貨を獲得するようプレイヤーにリマインドしたりもできます。これはあまりにも魅力的すぎるでしょうか?必ずしもそうではありません。AIのコーチングは表面的なもので、試合の合間に自分で確認できるピック構築以外のアドバイスや戦略は提供されませんでした。

真の「エージェント」AIは、Google DeepMindが待ち望んでいたProject Astraかもしれません。Gizmodoは今年初めのGoogle I/Oで、このツールの過去のバージョンを実際に使用しました。このツールはGemini Liveに似ていますが、スマートフォンのカメラを使った視覚情報と解釈機能がはるかに優れています。最新バージョンでは、より会話的で質の高い対話が可能になるとされています。また、会話内容を記憶し、Google検索、Googleレンズ、Googleマップと連携できるようになりました。

Astraがより多くのユーザーに利用可能になる時期についてはまだ発表されていません。現時点ではこの機能はまだテスト段階にあり、将来的にはGeminiのさまざまな製品に一部組み込まれる可能性があります。

Googleの「ディープリサーチ」モデルは、Gemini 2.0でGoogle検索のプロになった気分を味わえるはずだ

インターネットのウサギの穴は深いですが、Googleはあなたに代わって掘り起こすための新しいツールを発表しました。もしすべてを信頼できるなら、それはネットから情報を盗み出します。同社のDeep Researchツールは、まず「調査プラン」を作成します。これは基本的にレポート全体のアウトラインです。次に、該当するウェブサイトのリストを調べ、表やグラフを含む複数ページにわたるレポートにまとめます。一番下には、情報の入手元が表示されます。

このツールは、本日よりGemini Advancedの全ユーザーに英語で提供されます。現在はChromebookなどのデスクトップデバイスまたはブラウザからのみ利用可能ですが、モバイル版は来年中に利用可能になる予定です。

このプロセス全体には、ある程度の時間がかかります。例えば、私はGemini Advancedに、2014年の買収以前のDeepMindとGoogleのこれまでの関係について調査を依頼しました。Geminiは、DeepMindの初期段階や学術出版物を通じた資金調達など、自社の研究計画を説明しました。Googleによると、ドロップダウンメニューから「1.5 Pro with Deep Research」を選択する必要があるとのことですが、この記事の執筆時点では私のアカウントでは選択できませんでした。AIチャットボットは自分が何をすべきか分かっていると主張したので、レポートを完成させるように指示しました。そして、ひたすら待つことになりました…。

スクリーンショット 2024 12 11 12.27.34 午後
© スクリーンショット: カイル・バー / Gizmodo

Googleのブログには、このツールが分析を精緻化するのに「数分」かかると記載されています。Gemini Advancedを起動して、調査にどれくらいの時間がかかるか尋ねたところ、Geminiは「レポートの作成には6~12時間かかる」と回答しました。

このツールは明らかに新しいので、AIがタイムテーブルを教えてくれる時はあまり正確ではないかもしれないが、それでも笑わずにはいられない。AIが教えてくれる時間は、平均的な大学生が提出期限前夜に土壇場でレポートを作成するのにかかる時間とほぼ同じだ。

Googleのディープリサーチは、100万トークンのコンテキストウィンドウを持つより大規模なGeminiモデルで動作しますが、必ずしも正確であるとは限りません。GoogleのAI検索は、必ずしも正確ではないウェブサイトや、信頼できないサイトからのサニタイズされた情報を提示するウェブサイトを拾い上げてしまうことがあります。そのため、Geminiツールでは、テキストプロンプトの下にあるすべての回答を「再確認」するようユーザーに促しています。

Tagged: