アントロピック、新しいClaude 3.5 AIモデルがGPT-4 Omniを上回ると発表

アントロピック、新しいClaude 3.5 AIモデルがGPT-4 Omniを上回ると発表

AIスタートアップのAnthropicは木曜日にClaude 3.5 Sonnetをリリースしました。同社によると、Claude 3.5 Sonnetは、複数の指標において、同社の従来のAIモデルやOpenAIが最近リリースしたGPT-4 Omniを凌駕する性能を誇っています。また、同社はClaude内に新しい動的ワークスペース「Artifacts」をリリースしました。ユーザーは、プレイ可能なカニのビデオゲームなど、ClaudeのAIプロジェクトを編集・構築することができます。

「Claudeの目標は、LLMを段階的に改善することではなく、人間やソフトウェアと有意義な方法で連携できるAIシステムを開発することです」と、Anthropicの共同創業者兼CEOであるダリオ・アモデイ氏はプレスリリースで述べています。「Artifactsのような機能は、まさにこの方向に向けた初期の実験です。」

これは、AnthropicのClaude 3.5モデルファミリーの最初のリリースであり、Claude 3モデルの発売からわずか3か月後に登場します。Anthropicは、OpenAIの製品リリースに追いつくために全力を尽くしています。現在、Anthropicは中級モデルSonnetのバージョン3.5をリリースしたばかりですが、同社は今年後半にHaiku(エントリーレベルモデル)とOpus(最高性能バージョン)のバージョン3.5をリリースする予定です。また、将来のリリースに向けて、Web検索やメモリなどの機能を検討しているとのことです。

Anthropicは、より優れたモデルだけでなく、AIをより便利にするための機能や性能の向上にも注力しています。Anthropicによると、Artifactsでは、ユーザーはClaude内でインタラクティブなプロジェクトを作成できるとのことです。デモでは、AIが生成した8ビットのカニのビデオゲーム内でキャラクターやアイコンを作成し、その過程でプロジェクトを編集する方法が紹介されています。

AIスタートアップのAnthropic社は、Claude 3.5 Sonnetがこれまでで最も強力なビジョンモデルであり、視覚的推論、グラフの解釈、不完全な画像からのテキスト転記において優れたパフォーマンスを発揮すると述べている。Anthropic社は、Claude 3.5 Sonnetが、発売時に優れたビジョン機能を初めて搭載したGPT-4 Omniのいくつかのビジョン機能を凌駕していると主張している。Claudeは、グラフ、文書、数学の視覚的理解において優れているとされている。その他、Anthropic社は、新しいClaudeはコーディングと推論においてOpenAIのChatGPTを概ね上回っていると述べている。

特筆すべき点として、Anthropic社によると、Claude 3.5 Sonnetは、回答すべきものと回答すべきでないものを判断する能力が向上しています。AIチャットボットは、特定の質問への回答を拒否することで悪名高い存在となっています。Gizmodoは数ヶ月前にAIによる検閲について深く調査し、Anthropic社のClaudeが多くの質問への回答を拒否したことを発見しました。Claude 3.5では、Anthropic社はClaudeが不適切または潜在的に有害な質問に回答する際の判断力に自信を持っています。

クロードさんの質問に答えるべきかどうかを判断する能力が向上しました。
クロードの質問に答えるべきかどうかを判断する能力が向上しました。画像:アントロピック
Tagged: