GoogleがI/O 2023で発表したAI、Bard、PaLM 2に関するすべての情報

GoogleがI/O 2023で発表したAI、Bard、PaLM 2に関するすべての情報

Googleの最新のI/Oイベントが始まる前から、このテクノロジー界の巨人は既に自社の最新AIの存在感を示そうとしていた。集まった観客に向けて、ミュージシャンのダン・ディーコンがトリッピーでチップチューン風のエレクトロニックボーカルを演奏する中、同社は最新のテキスト動画AIモデルを、オフィスにいる人々、宇宙旅行、そしてつぶやく唇に囲まれた変異したアヒルたちをフィーチャーしたサイケデリックなスライドショーで披露した。

この壮大なショーは、Googleが2023年に向けて強力な武器を投入し、進行中のAI競争においてこれまでで最大の攻勢を仕掛けることを示すためのものでした。Google I/Oでは、社内向けおよび一般向けのAIの最新導入事例を多数公開しました。CEOのサンダー・ピチャイ氏は、AIを「すべての人にとって」役立つものにしたいと述べました。

これが実際に意味するのは、単純に言えば、Google が、自社の計画しているユーザー向けソフトウェア製品やアプリに何らかの AI を組み込むことを計画しているということだ。

Googleの言語モデルの続編であるPaLM 2

Google によれば、LLM には「Gecko」サイズから「Unicorn」サイズまで、複数のスケール バージョンがあるという。
Googleは、LLMには「Gecko」サイズから「Unicorn」サイズまで、複数のスケールバージョンがあると述べている。スクリーンショット:Google / Gizmodo

Googleは、AIチャットボットやその他のテキストベースサービスをさらに加速させる最新の大規模言語モデルを発表しました。同社によると、この新しい法学修士課程(LLM)は100以上の言語を学習し、優れたコーディング、数学、そしてクリエイティブライティングの能力を備えているとのことです。

同社によると、PaLMには4つの異なるバージョンがあり、最小バージョンの「Gecko」はモバイルデバイスで動作できるほど小型です。ピチャイ氏は、ユーザーがコード行を韓国語に翻訳しながら、他の開発者にコメントを渡すようPaLM 2に依頼した例を示しました。PaLMは今年後半にプレビュー版として提供される予定です。

PaLM 2は、2022年のPaLMと、今年初めにリリースされたMarchのPaLM-Eマルチモーダルモデルの続編です。さらに、Med-PaLM 2と呼ばれる限定的な医療ベースのLLMは、医療に関する質問に正確に回答できるとされています。Googleは、このシステムが米国医師免許試験で85%の精度を達成したと主張しています。医療分野におけるAIの活用には依然として多くの倫理的問題が残されていますが、ピチャイ氏は、Med-PaLMがX線などの画像を見て医療診断を識別できるようになることを期待していると述べました。

GoogleのBardのアップグレード

Googleによると、会話型AIの「実験」に大幅なアップグレードが施されたという。現在はPaLM 2上で動作し、ダークモードも搭載されているが、GoogleアシスタントとBard担当バイスプレジデントのシシー・シャオ氏によると、チームはBardの機能を「急速に改善」しているという。彼女は特に、Bardが20以上のプログラミング言語で学習済みであるため、プログラムのコーディングやデバッグができる点を挙げた。

Googleは、Bard AIのウェイティングリストをついに撤廃し、180カ国以上で公開すると発表した。Bardは日本語と韓国語にも対応する予定で、Hsiao氏によると「まもなく」約40言語に対応できるようになるという。

Hsiao氏は、Bardがチェスのゲームで特定の動きを行うためのPythonスクリプトを作成する例を挙げました。AIはコードの一部を説明したり、ベースに追加すべき点を提案したりすることもできます。

BardはGmail、スプレッドシート、ドキュメントに直接統合でき、テキストをこれらのプログラムに直接エクスポートできます。また、BardはGoogle検索を利用して、回答に画像や説明を表示します。

同社は、Instacart、Indeed、Khan Academyといったサイトや、既存のGoogleアプリの多くからの拡張機能をBard AIで利用できるようにしています。また、Adobe Firefly AI画像ジェネレーターなどのサードパーティ製アプリとの接続も強化しており、外部システムを利用して画像を生成することも可能です。

Google検索におけるAI

スクリーンショット: Google / Gizmodo
スクリーンショット: Google / Gizmodo

Googleの主力サービスである検索に、同社のAIが統合され、ユーザーの検索クエリの「スナップショット」が作成されます。ブラウザ版Google検索では、AIが生成した要約がページ上部に表示され、右側にはAIが生成したテキストに関連するリンクが表示されます。

ユーザーはクリックしてビューを展開することができ、各行のテキストには、トピックをより詳細に掘り下げたリンクが表示されます。同社によると、これはユーザーにとっての「出発点」となり、検索の出発点となると同時に、公式ソースやユーザーのブログにもアクセスできるとのことです。

AIスナップショットは、ユーザーが商品を検索するときにも機能し、検索語句に価格とコメントを表示します。例えば、「坂道のある5マイルの通勤に適した自転車」を検索すると、デザインと電動アシストに関するいくつかの箇条書きが生成され、それらの基準に基づいて複数のブランドがランキング表示されます。

このシステムはモバイルでも利用可能で、動画、画像、ニュースなどの横に「Converse」タブが表示されます。Androidでは、スナップショットが画面の大部分を占め、拡張された検索結果は画面下部に表示されます。以前のプロンプトはすべて上部に表示され、ユーザーは上にスクロールして以前の結果を確認できます。ページを下にスクロールし続けると、通常の検索結果と同様に、さらに多くのリンクが表示されます。

Googleは依然として、これを検索におけるAIの「実験」と呼んでいます。利用できる人数には限りがあり、新しい検索AIにアクセスし、コーディング支援にAIを利用したい人のために、新しいSearch Labsプラットフォームに現在順番待ちリストが掲載されています。

Workspace アプリの AI がさらに強化され、AI があなたに代わってメールをお送りします

Googleは既にGmailとGoogleドキュメントにAIコンテンツ生成機能を追加することを発表していますが、今回、いわゆる「Workspace AI collaborator」を拡張し、クラウドベースのアプリにさらなる生成機能を追加すると発表しました。これらの生成AIと「サイドキック」機能は限定的にリリースされていますが、今年後半にはより幅広いユーザーに提供される予定です。

マイクロソフトが今年初めに自社の365アプリで発表したのと同様、Googleもオフィス系アプリケーションに生成AI(Generative AI)を導入します。Google Workspace担当バイスプレジデントのアパルナ・パップ氏は、Gmailとドキュメントに「文章作成を手伝って」機能を限定的に導入したことに加え、スライドやスプレッドシートを含む複数のWorkspaceアプリに新しいAI機能を追加すると発表しました。スプレッドシートアプリケーションは、ユーザーの指示に基づいて、例えば犬の散歩代行サービスの顧客リストなど、汎用的なテンプレートを生成できます。

Googleは、AIを活用して過去のメールに基づいて完全な返信メールを生成する新機能「Help me write(書き方を手伝って)」を発表しました。ユーザーはこれらのメールを繰り返し作成することで、内容をより複雑にしたり、より簡潔にしたりできます。ピチャイ氏は、欠航となったフライトの払い戻しをカスタマーサービスに依頼するユーザーを例に挙げました。これは、スマート作成やスマート返信といった、Gmailに以前から存在するコンテンツ生成機能に加えて提供されるものです。

スライドでは、テキストから画像を生成する機能を使ってスライドショーに追加できるようになりました。このジェネレーターは画像の複数のインスタンスを作成し、ユーザーは異なるスタイルでプロンプトをさらに調整できます。

Gmailでは、AI「サイドキック」がメールスレッドを自動的に要約し、その会話に関連する過去の文書を検索して引用できます。ドキュメントに関しては、既存のAIがより精巧になっています。生成されたテキストに基づいて追加のプロンプトを提案するようになったほか、AIが生成した画像をドキュメント内に直接追加できるようになりました。これはスライドでも機能し、ユーザーはAIが生成した各スライドの要約に基づいて発表者メモを作成できます。

AIが生成した壁紙とAIが書いたテキスト

スクリーンショット: Google / Gizmodo
スクリーンショット: Google / Gizmodo

Google は、Android モバイル デバイス上でのあらゆるユーザー エクスペリエンスを AI でパーソナライズできるようにしたいと考えており、ユーザーが AI を使用して、AI が生成した画像で携帯電話の壁紙をカスタマイズできるようにすることさえ考えています。

同社は、メッセージアプリに生成AI(Generative AI)を搭載することを発表しました。この「Magic Compose(マジックコンポーズ)」機能は、ユーザーに返信文を提案したり、メッセージの下書き全体を書き直したりします。AIは、「ワクワク」から「まったり」、さらには「シェイクスピア」まで、6種類のスタイルから選択できます。メッセージAIは今夏、ユーザーのデバイスでベータ版として公開されます。

ユーザーは、内蔵のテキストから画像への拡散モデルを用いて、AIに壁紙を一から生成させることもできます。ユーザーは「構造化されたプロンプト」に従って、例えばテーマやアートスタイルなどを含む画像を作成できます。ユーザーがAI壁紙を設定すると、スマートフォンは新しいカラーパレットに適応します。AIは既存の写真から「3D壁紙」を作成することもできます。これは、スマートフォンの動きに合わせて視差効果でスクロールする背景を導入します。絵文字を使ったカスタムリアクティブ壁紙もありますが、これはAIを活用したものではありません。

これは、今年後半にリリースされるAndroid 14で導入される新しい画面カスタマイズオプションに加えて提供されるものです。新しいインターフェースを使用することで、ユーザーはロック画面のショートカットやウィジェットの位置、色、テーマをより細かく編集し、パーソナライズできるようになります。

Google フォトの新しいマジックエディター AI 機能

Googleは、AIベースの編集機能スイート「Magic Eraser」の最新アップデートを公開しました。写真から不要な人物やアイテム、その他の要素を削除するだけでなく、写真内のオブジェクトを変形させることも可能になるとGoogleは発表しました。バッグストラップを外したり、被写体を含むオブジェクトを画像内の別の場所に移動させたりする方法も紹介されました。

GIF: Google
GIF: Google

写真アプリでは、照明や空の雲など、画像の要素を強調することも可能になります。Googleによると、これらのアップデートにより、これらの要素が画像の他の部分に「シームレスに」溶け込むようになるとのことです。

すべての Pixel スマートフォンは今年後半に Magic Editor への早期アクセスが可能になる予定だが、同社はプロモーションビデオほどすっきりした見た目ではないかもしれないと明言している。

AIがGoogleマップをさらに没入感のあるものに

GIF: Google
GIF: Google

Googleの新しいAIツールの力を借りて、Googleマップはまもなく、これまではランドマークに焦点を当てていたはるかに精巧なイマーシブビュー機能を搭載します。これは、ストリートビューで撮影された数十億枚の画像と衛星画像を活用し、ユーザーが提案されたルートをさらに探索できるようにします。ルートプランニングはまるでインタラクティブなビデオゲームのようで、サイクリストは自分が利用する自転車レーンを鳥瞰図で見ることができます。ドライバーは交差点をプレビューし、目的地周辺の駐車スペースの数まで確認できます。プレビューされたルートには、時間帯による天気も表示されるため、すべての曲がり角を事前に把握できるだけでなく、どのような服装をすべきかまで把握できます。

ルートのイマーシブビューは、今後数か月以内に「アムステルダム、ベルリン、ダブリン、フィレンツェ、ラスベガス、ロンドン、ロサンゼルス、ニューヨーク、マイアミ、パリ、シアトル、サンフランシスコ、サンノゼ、東京、ヴェネツィア」などの都市で利用可能になる予定です。

GIF: Google
GIF: Google

開発者向けでは、Googleが新しい「Aerial View API」を導入します。これにより、アプリ開発者は詳細な3D俯瞰画像を含む、より没入感のあるPOI(関心地点)を追加できるようになります。これにより、ユーザーは特定の場所だけでなく、その周辺エリアも見ることができます。このAPIの優れた用途の一つとして、不動産業者やアパート探しのアプリが挙げられます。購入希望者や賃貸希望者は、周辺地域の様子や、公園などの近隣のアメニティ、さらには主要道路へのアクセス状況などを確認することができます。

Googleはまた、実験的な新リリースの一環として、「Google Earth の高解像度 3D 画像」を開発者向けに公開しています。これにより、アプリ開発者は独自の衛星画像や 3D モデル生成を行うことなく、同様の没入型体験を実現できるようになります。Google は本日のブログ投稿で、このツールが観光業にとって非常に役立つ可能性を示唆しています。国立公園の 3D マップを簡単に作成でき、3D の山、木、川も再現できるため、旅行を計画する前に目的地を詳細に確認したり、建築物に関する興味深い事実や歴史をインタラクティブにオーバーレイ表示することで、その体験を充実させたりすることが可能になります。

Googleは新しいAPIを積極的に推進している

Googleは今年3月、独自のPaLM APIの販売を発表しました。常に嫉妬深いダンスパートナーであるGoogleは、AIを既存サービスに統合するための独自のAPIによって、OpenAIに匹敵する人気を獲得しようとしています。

Google CloudのCEO、トーマス・クリアン氏はI/Oの聴衆に対し、同社はSalesforceのような多くのエンタープライズサービスと提携しているが、Googleの事業のクラウドエンタープライズ側を通じてCanva、Uber、さらにはWendy'sのような企業にもLLMを提供していると語った。

Canva は今年初めにすでにベータ版 AI ツールを自社のプログラムに導入しているが、Wendy's も、Google の Chirp 言語テキスト モデルを活用したチャットボット搭載ドライブスルーで AI テクノロジーに真っ先に飛び込んでいる。

同社はまた、コード生成サービス「Codey」をサービスとしてのソフトウェア企業Replitなどの他の企業にも宣伝しており、ユーザーはアプリを使って新しいプログラムのコードをほぼ瞬時に作成できると述べた。

これは Google にとって何を意味するのでしょうか?

Googleが社内のあらゆる組織をAI開発に注力していることは周知の事実だが、同社はこれまで、その再重点化を正当化するのに苦労してきた。野放しのAI開発の危険性を警告するために、著名な研究者がGoogleを去った。Googleのエンジニアが投稿した広く流布された社内文書は、Googleは独自のAI開発に注力するのではなく、オープンソース開発を統合することに注力する必要があると宣言した。

「我々は、ワクワクしながら大胆に取り組んでいます。正しく実行するという強い決意を強調しながら、責任を持って取り組んでいます」とピチャイ氏は基調講演で述べた。

水曜日の発表は、AI分野における同社のイメージを一新するはずだった。昨年、GoogleはMicrosoftとそのOpenAIのGPT-4言語モデルに基づくBing AIに先を越された。また、同社独自のBard AIは、公開デビュー時にチャットボットの精度の低さが露呈したことで、同社の名声と株価に数百万ドルの損失をもたらした。

長年AI開発を牽引してきた同社にとって、Bardの初公開はやや物足りなさを感じさせるものだったと、総じて評価されている。しかし、Bard AIが世界に解き放たれ、Google検索の全く新しいUIも間もなく登場する今、同社は検索分野における優位性を取り戻し、あるいは少なくとも維持したいと考えている。

また、コーディングを重視するGoogleは、エンタープライズビジネスパートナーに対し、ビジネスニーズに合わせてGPT-4などのLLMではなく、PalMを採用するよう働きかけています。言語モデルによるコード生成には避けられない問題があり、最も洗練されたモデルであっても、必ずどこかで間違いが生じる可能性があります。Googleは、他社がほとんど行っていない、あるいはおそらく実行できないこと、つまり、PaLMの拡張版を開発しています。前述のように、「Gecko」サイズのLLMはスマートフォン上で直接実行できますが、「Unicorn」バージョンのPaLMははるかに大規模になる予定です。Googleは、これらの言語モデルが「あらゆるクラスの製品をサポートする」ことを謳っています。

AIモデルが大規模になればなるほど電力消費量が増加し、学習と継続的な実行に多大なコストがかかります。さらに、マシンの冷却に必要な水の量も増えます。モデルの拡張による明らかな気候への影響がなくても、こうした巨額の費用がかかるため、GoogleはAIへの投資を回収するか、少なくともユーザーや企業がMicrosoftに流れてしまわないように、その数を安定させる必要があります。


Gizmodoのおすすめ家電製品をもっとご覧になりたいですか? 最高のスマートフォン、最高のノートパソコン、最高のカメラ、最高のテレビ、最高のプリンター、最高のタブレットのガイドをご覧ください。次なる目玉について知りたい方は、iPhone 15について私たちが知っているすべてをまとめたガイドをご覧ください。The Inventoryの友人たちが提供してくれた、今日の最高のお買い得情報はこちらをクリックしてご覧ください。

Tagged: