イーロン・マスクがOpenAIを嫌う理由がまた一つ必要だったかのように。OpenAIと提携してヒューマノイドロボットを開発しているスタートアップ企業Figureが水曜日に新しいビデオを公開した。そして、そのビデオはテスラがこれまでOptimusロボットで実証してきたものよりもはるかに優れている。
YouTubeで公開されているFigureの動画では、人間が「Figure 01」(フィギュア・ワンと発音)と名付けられたロボットと対話している様子が映し出されています。人間はロボットと自然な会話を交わし、まずロボットが何を見ているのかを尋ねます。
「テーブルの中央のお皿の上に赤いリンゴが乗っていて、乾燥ラックにはカップとお皿が置いてあり、あなたは近くに立ってテーブルに手を乗せています」と図 01 は人間のような口調で説明しています。
人間が何か食べ物を頼むと、図01はリンゴを手渡します。次に人間は環境にゴミを出し、ロボットになぜそのような行動をとったのか説明を求め、同時にゴミを拾い上げます。もちろん、ロボットが指示を処理する間に多少の遅延はありますが、それ以外は完璧にコマンドを実行します。
「その通り。だから、リンゴをあげたのは、テーブルから君に提供できる唯一の、えーと、食べられるものだったからだ」と、図01は不気味なほど人間らしい「えー」という発音で文の途中で割り込んでくる。
最後のトリックとして、人間はテーブル上の食器の配置に基づいて次に何をすべきかをフィギュア01に尋ねます。ロボットは次に食器を乾燥ラックに入れる可能性が高いと答えます。人間は口頭でその仮定を検証し、フィギュア01にまさにそうするように指示します。すると、まずカップを持ち上げてひっくり返し、元の場所に戻すという驚くべき器用さと正確さを見せます。そして、フィギュア01が皿を乾燥ラックの適切な位置に置いた時にも、精密さが改めて示されます。
何が起こっているのかを正しく理解するには、以下に埋め込まれたビデオ全体を見る価値があります。
一体何がそんなにすごいのか、と疑問に思う人もいるかもしれません。確かに、マスク氏は2021年にロボットのコスチュームを着た人物を使ってロボットを発表しましたが、それ以来、テスラはOpenAIやFigureに匹敵するほどの驚異的な進歩を遂げてきたのではないでしょうか。しかし、そうではありません。
テスラのオプティマスは歩き回り、卵を拾い、洗濯物を畳むことさえできます。これはかなりすごいと思いませんか?ただし、イーロン・マスクのロボットデモンストレーション動画を額面通りに受け取った場合の話です。例えば、1月に公開された洗濯物を畳む動画をよく見てみてください。あの一見すごい動画の右下に何かおかしな点があることに気づきましたか?

まだ分かりませんか?大きな赤い矢印を追加してみてはどうでしょうか?視界に現れたり消えたりする手が、オプティマスの右手の動きと完全に一致していることに気づきますか?

そうです、誰かが遠隔操作で動きを作り、それをオプティマスが真似しているようです。人間が遠隔操作でシャツを畳んでいるようなもので、いわゆる「ワルド」と呼ばれています。
人類は少なくとも1940年代からウォーリーロボットを作り、少なくとも1960年代から人間型ロボットに遠隔操作機能を搭載してきました。正直なところ、テスラのオプティマスが披露する技術は、ディズニーが1964年のニューヨーク万国博覧会のために制作したオーディオ・アニマトロニクス(以下参照)と比べても、それほど印象に残るものではありません。

画像:ディズニー
テスラの動画をよく見ていれば、偶然明らかになった事実が、FigureとOpenAIのロボットが他社をはるかに凌駕している理由を物語っている。Figureの共同創業者であるブレット・アドコック氏が水曜日に明らかにしたように、Figure 01は遠隔操作などの技術を一切使っていないからだ。
「この動画はエンドツーエンドのニューラルネットワークを映し出しています。テレオペレーションはありません」とアドコック氏はXに記した。「また、これは1.0倍速で連続撮影されています。」
マスク氏とテスラチームに、この問題を解決できる能力があるだろうか?もちろんある。しかし、水曜日の動画が明らかに示しているように、アドコック氏とFigureの面々は大きなリードを握っている。そして、Figureはボストン・ダイナミクスやディープマインドといった企業出身の、自分たちの仕事に精通した人材を集めたチームを編成している。
FigureでAI開発に携わるコーリー・リンチ氏は、水曜日のツイートで自身の仕事に明らかに誇りを示し、最新の進歩について説明しつつも、Figure 01は遠隔操作されていないと指摘した。Figureの従業員が、ロボットは人間によって操作されていないと繰り返し主張しているのは、最近OpenAIを提訴したマスク氏への皮肉としか解釈できない。
「ほんの数年前でさえ、ヒューマノイドロボットが自ら学習した行動を計画し、実行しながら、完全な会話を交わすようになるには、何十年も待たなければならないだろうと思っていました」とリンチ氏は書いている。「明らかに、多くのことが変わりました。」
2015年のDARPAのロボット競技会ではまだ遠隔操作マシンが使われていた、比較的原始的な時代から見ても、確かに変化しました。マスク氏のチームが2015年に追いつけるかどうかは、今後の展開を見守るしかありません。