今週、AI界全体が「Q」について話題にしていた理由

今週、AI界全体が「Q」について話題にしていた理由

人工知能の分野で何が起こっているかをGizmodoが毎週詳しく掘り下げる「AI This Week」へようこそ。

先週の衝撃的なOpenAIの権力闘争の余波の中、この混乱のエピローグとも言うべき最後の新事実が明らかになった。ロイター通信の報道で、このスタートアップ企業における驚くべき画期的な進歩が明らかになったのだ。その画期的な進歩は、「Q-Star」または「Q*」と呼ばれる、あまり知られていないプログラムによってもたらされたとされている。

報道によると、この影響力のあるAI企業における社内抗争の発端の一つは、このQ関連の「発見」だった可能性がある。アルトマン氏の解任に先立ち、OpenAIの複数のスタッフが同社の取締役会に「人類を脅かす可能性のある強力な人工知能の発見」について書簡を送ったとされている。ロイター通信は匿名の情報筋を引用し、この書簡は「取締役会によるアルトマン氏の解任につながった数々の不満の一つ」だったと主張した。

率直に言って、この話はかなりクレイジーに聞こえました。この奇妙な新プログラムとは何なのか、そしてなぜOpenAIでこれほどの混乱を引き起こしたとされているのか?ロイター通信は、Q*プログラムによってAIエージェントが「小学校レベルの数学」を行えるようになったと主張しました。もしこれが事実であれば、これは驚くべき技術革新であり、汎用人工知能(AGI)の開発におけるさらなる成功につながる可能性があると関係者は述べています。The Informationの別の報道は、ロイター通信の記事で指摘された多くの点を概ね繰り返していました。

それでも、このいわゆるQプログラムに関する詳細は同社から公表されておらず、プログラムの真の本質が何であるかについては、匿名の情報源による報告とオンラインで飛び交う憶測だけが残っている。

このプログラムは(その名前から)機械学習の一種であるQ学習と関連しているのではないかと推測する人もいます。では、Q学習とは何でしょうか?そして、OpenAIの秘密のプログラムにどのように応用できるのでしょうか?

一般的に、AIプログラムに何かを教える方法はいくつかあります。その一つは「教師あり学習」と呼ばれ、AIエージェントに大量の「ラベル付き」データを与え、それを用いてプログラムが特定の機能(典型的にはデータ分類)を自ら実行できるように学習させます。OpenAIのコンテンツ生成ボットであるChatGPTのようなプログラムは、概して何らかの形の教師あり学習を用いて作成されています。

一方、教師なし学習は機械学習の一種で、AIアルゴリズムがラベル付けされていない大量のデータをふるいにかけ、分類すべきパターンを見つけ出すことを可能にします。この種の人工知能は、NetflixやSpotifyなどの企業がユーザーの過去の購買行動に基づいて新しいコンテンツを提案するレコメンデーションシステムの構築など、様々な用途に活用できます。

最後に、強化学習(RL)があります。これは機械学習(ML)の一種で、AIプログラムが特定の環境内で目標を達成するように動機付けます。Q学習は強化学習のサブカテゴリです。RLでは、研究者はAIエージェントを訓練しようとしている犬のように扱います。プログラムは、特定の結果をもたらす特定の行動をとれば「報酬」が与えられ、そうでない場合はペナルティを受けます。このようにして、プログラムは与えられた状況において最適な結果を求めるように効果的に「訓練」されます。Q学習では、エージェントは試行錯誤を繰り返しながら、プログラムされた目標を達成するための最善の方法を見つけ出すようです。

一体これは、OpenAIのいわゆる「数学」におけるブレークスルーとどう関係しているのだろうか?単純な数学演算を実行できたとされるこのプログラムは、何らかのQ関連の強化学習によってその能力を獲得したのではないかと推測できる。とはいえ、多くの専門家は、AIプログラムが実際に数学の問題を解けるかどうかについて、やや懐疑的だ。また、たとえAIがそのような目標を達成できたとしても、それが必ずしもより広範なAGIのブレークスルーにつながるとは限らないと考える専門家もいるようだ。MITテクノロジーレビューは次のように報じている。

研究者たちは長年、AIモデルに数学の問題を解かせようと試みてきました。ChatGPTやGPT-4のような言語モデルはある程度の数学計算はできますが、それほど優れた性能や信頼性があるわけではありません。エディンバラ大学のAI講​​師であるウェンダ・リー氏は、「現時点では、AIを用いて数学の問題を確実に解くためのアルゴリズムはおろか、適切なアーキテクチャさえも存在しません」と述べています。言語モデルで用いられるディープラーニングとトランスフォーマー(ニューラルネットワークの一種)はパターン認識に優れていますが、それだけでは十分ではない可能性が高いとリー氏は付け加えています。

要するに、私たちは Q について本当にほとんど何も知らないが、専門家の言うことを信じるならば、Q をめぐる誇大宣伝は単なる誇大宣伝なのかもしれない。

今日の質問: 実際のところ、サム・アルトマンに一体何が起こったのでしょうか?

写真: ジャスティン・サリバン
写真:ジャスティン・サリバン(ゲッティイメージズ)

サム・アルトマン氏はOpenAIに復帰したにもかかわらず、先週一体何が起こったのかは未だに不明だ。水曜日にThe Vergeのインタビューを受けたアルトマン氏は、社内で起きた劇的な権力闘争のきっかけについてほとんど何も語らなかった。同メディアの記者からの執拗な追及にも関わらず、アルトマン氏はただ両手を上げて、当面はこの件について語らないと答えた。「人々が今すぐに答えを知りたいのはよく分かります。しかし、それを期待するのは全く無理だと思います」と、立ち直ったCEOは語った。The VergeがOpenAI幹部から聞き出せたのは、同社が現在「独立した調査」を実施中であるということだけで、アルトマン氏はこの調査に「干渉」したくないと述べている。先週の騒動に関する私たち自身の報道では、理事会の倫理観と、アルトマン氏がOpenAIの自動化技術の商業化に執拗に取り組んだこととの衝突という物語として解釈しました。しかし、この物語はあくまで物語に過ぎません。サム氏の解任に至った経緯の詳細は分かりませんが、ぜひ知りたいものです。

今週のその他の見出し

イスラエルは、パレスチナの武装勢力の容疑者を特定するためにAIを活用している。もし、政府が現代戦においてAIを兵器化することに時間を浪費するのではないかと懸念しているなら、この話を聞いてほしい。ガーディアン紙の記事によると、イスラエルは現在、パレスチナ国内の武装勢力の標的を特定するために、「ハブソラ(福音)」と名付けられたAIプログラムを使用している。イスラエル国防軍のウェブサイトに掲載された声明には、このプログラムは「標的を迅速に生成する」ために使用されていると記されている。ガーディアン紙の情報筋によると、このプログラムはイスラエル国防軍が約3万人から4万人の武装勢力の容疑者データベースを構築するのに役立ったという。ガーディアン紙は、「福音のようなシステムは…(情報筋によると)暗殺を許可された人物のリストを作成する上で重要な役割を果たしていた」と報じている。

Cruiseロボタクシーは苦戦が続いている。ゼネラルモーターズ(GM)傘下のロボタクシー会社Cruiseは、非常に厳しい一年を過ごしている。サンフランシスコでの数々の事故をめぐる騒動を受け、先週CEOが辞任した。今週、GMがCruiseへの投資を縮小すると報じられた。「操業再開後のCruiseの事業拡大ペースはより慎重になる見込みで、2024年の支出は2023年よりも大幅に減少するだろう」と、GMのメアリー・バーラCEOは水曜日の投資家向けカンファレンスで述べたと報じられている。

Tagged: