好むと好まざるとにかかわらず、Metaは3Dアバターベビーサークルを未来のコンピューティングの代名詞にすべく、その取り組みを一層強化している。火曜日のイベントでは、音声アシスタント、ユニバーサル言語翻訳機、音声コマンドでデジタルオブジェクトを生成できるプログラミングツールなど、様々な新しいAIツールを披露した。これらはすべて、将来、実際に利用可能なメタバースに命を吹き込むことを目指している。
これらのツールは、水曜日に開催されたMetaのライブストリームイベント「Inside the Lab: Building for the Metaverse with AI」で披露されました。イベント中、Metaは「Project CAIRaoke」と名付けた高度なデジタル音声アシスタントの開発を発表しました。ザッカーバーグ氏は、このツールが将来、ユーザーがメタバースをナビゲートするための重要な手段として利用されることを期待していると述べました。
Meta社は、Project CAIRaokeで開発されるモデルはまだ初期段階ではあるものの、会話中に以前に発せられた指示を記憶したり、話題を一変させたりできるようになると考えています。これは、現在のほとんどの音声アシスタントにはない、流動的な機能です。Siriのようなアシスタントでありながら、複数の会話に有機的に対応できるアシスタントを想像してみてください。Meta AIのシニアリサーチマネージャー、アルボルズ・ジェラミファード氏は、こうしたアシスタントを「スーパーチャージド・アシスタント」と呼んでいます。
ああ、ついに、永久に議論できる音声アシスタントが登場しました。

Meta氏はさらに、このアシスタントの初期バージョンがPortalホームデバイスに展開され、リマインダーの設定に利用できるようになると述べました。これが必ずしもハイテクイノベーションだとは思わないかもしれませんが、ご安心ください。Meta氏によると、遅かれ早かれこのAIを使ってパーソナライズされたショッピングができるようになるかもしれません!
将来的には、同社はAIアシスタントをARやVRデバイスと融合させることを構想しています。ある動画では、ARグラスを装着した男性がアシスタントを使ってスープのレシピを案内する様子が映し出されていました。アシスタントが「塩の入れすぎに注意」と注意する間、画面上にテキストが反転して表示されました。
「拡張現実デバイスと仮想現実デバイスをプロジェクトCAIRaokeモデルと組み合わせることで、会話型AIの未来がよりパーソナルでシームレスなものになることを期待しています」と、プレゼンテーションビデオの中でナレーターが語った。
Metaはまた、音声操作によるAI生成ツール「Builder Bot」の詳細も明らかにした。同社はこのツールを仮想世界の移動に不可欠だと捉えている。デモンストレーション中、ザッカーバーグ氏はまず低解像度の空の仮想世界とインタラクションし、音声コマンドを使って世界を構築し始めた。ザッカーバーグ氏のアバターはまず3D環境全体を公園に、そしてビーチへと変化させたが、これは音声コマンドのみで実現したと同氏は主張している。
デモでは、AIが音声コマンドに基づいてピクニックテーブル、ラジカセ、飲み物、その他の小物を生成する様子が映し出されます。The Vergeが指摘しているように、Builder Botがこれらのタスクを完了するために既に定義されたオブジェクトのライブラリを参照するのか、それともAI自身が生成に関与するのかは不明です(後者の方が明らかにはるかに印象的です)。ザッカーバーグ氏によると、これらすべての目的は「探索できる繊細な世界を創造し、声だけで他の人と体験を共有すること」です。
最後に、同社はAIベースのユニバーサル音声遷移システムの構築に向けた取り組みも紹介しました。Metaは、AIを活用した翻訳において2つの主要なアプローチを概説しました。1つ目は「No Language Left Behind(取り残された言語なし)」と名付けられ、あまり広く使用されていない、いわゆる「低リソース言語」に焦点を当てています。これらの言語は、一般的にAIシステムがより広く使用されている言語から学習するためのトレーニングデータが少ない傾向があります。Metaの推定によると、現在世界人口の約20%がこれらの言語を使用しており、オンラインの世界、そしておそらくMetaからも大きく排除されています。同社は、この新しいAIツールによって、これまで十分にサービスが提供されていなかったこれらの言語の高品質な翻訳が可能になることを期待しています。
2つ目のプロジェクト「ユニバーサル・スピーチ・トランスレーター」は、ARなどのツールを用いて、ある言語から別の言語へリアルタイムで音声翻訳を行うことを目的としています。同社はデモ動画で、このAI翻訳機をARグラスなどのウェアラブルデバイスと組み合わせることで、ユーザーが異なる言語を話す人々とリアルタイムでコミュニケーションできるようになる未来を描いています。もちろん、ここにもメタバースの要素が盛り込まれています。同社は「そう遠くない将来」、これらの翻訳ツールが仮想世界に統合され、ユーザーが「まるで隣人と交流するかのように」誰とでも交流できるようになると主張しています。
というわけで、Metaが準備しているのはまさにこれです。明るい面としては、水曜日の発表で、メタバースに関する最初の漠然としたプレゼンテーションで披露された、はるかに興味深く、潜在的に有用なツールを垣間見ることができました。しかし同時に、これらの提案のほとんどは実現には程遠いように思われます。また、これらのツールが、一般の人々の間でメタバースという概念への関心を高めるきっかけとなるかどうかも不透明です。
本稿執筆時点では、Meta の株価はさらに 1.8% 下落している。