ニュース

Anthropic、Mythosなみに優れた「Claude Fable 5」を発表

「Claude Mythos 5」もサイバー防御担当者とインフラストラクチャプロバイダー向けにリリース

 Anthropicは6月9日、一般使用でも安全なように改良したMythos級AI「Claude Fable 5」と「Claude Mythos」を発表した。「Fable 5」は同日より世界中で利用可能。

 利用料は、入力トークン100万個あたり10ドル、出力トークン100万個あたり50ドルで提供され、「Claude Mythos Preview」の半分以下の価格となっている。「Fable 5」は6月22日まで、Pro、Max、Team、およびシートベースのEnterpriseプランに無料で含まれる。

「Fable 5」は、ほぼすべてのベンチマークテストにおいて優秀な性能を記録しており、ソフトウェアエンジニアリング、知識労働、画像認識、科学研究など、多くの分野で優れたパフォーマンスを示している。また、特徴の一つとして、タスクが長く複雑になるほど、他のモデルを大きく上回る性能を示しているという。

 少数のサイバー防御担当者とインフラストラクチャプロバイダー向けにリリースされる「Claude Mythos 5」は、基本的には「Fable 5」と同じだが、一部の領域でセキュリティ対策が解除されている。リリース当初は米国政府の協力のもと、「Claude Mythos Preview」のアップグレードとして提供され、今後はより広範な信頼できるアクセスプログラムを通じ、「Mythos 5」を拡大していく予定。

Fable 5とMythos 5の性能を他の主要モデルと比較した表

 具体的な性能として、「Fable 5」は5,000万行のRubyコードベースにおいて、従来2か月以上かけチーム全体で手作業で行なっていた作業を、1日で完了したという。同時に「Fable 5」は、過去のClaudeモデルよりもトークン効率も優れている。

 また、上級レベルの推論能力を評価するHebbiaの「Finance Benchmark」では、他のどのモデルよりも高いスコアを獲得。文書ベースの推論、チャートと表の解釈、問題解決において大幅に向上している。

 視覚的な性能としては、詳細な科学図から正確な数値を抽出したり、スクリーンショットだけでWebアプリのソースコードを再構築するなど、複雑なタスクも実行可能となっている。YouTubeでは「ポケットモンスター ファイアレッド・リーフグリーン」を最後までプレイする様子をタイムラプスで撮影した動画も公開されている。

 このほかにも、創薬プロセスの一部を約10倍高速化できたという。

【Claude Fable 5 beats Pokemon FireRed only using vision】

「Claude Mythos」がリリースされたときに話題になった、セキュリティ問題に関する対策については、「Fable 5」では一部のトピックに関するクエリに対して、次善の選択肢として、より高性能なモデルである「Claude Opus 4.8」から応答が返されるように対策されている。

 なお、無害なリクエストでも、誤って問題に関連するトピックと検出されることがあるという。平均的にはセッションの5%未満で発生するという。今後数か月以内にさらに高性能なモデルが登場する予定で、セキュリティ対策の改善と誤検出の削減に取り組んでいくとしている。

 また、単にサイバーセキュリティのみならず、生物学や化学的な見地など広範囲にわたってセキュリティが施されている。薬を開発する研究者にとっては有益な情報も、兵器の開発者にとっては生物兵器の開発に悪用する可能性もある。

「Fable 5」では、脱獄の試みを含む潜在的な不正使用を検知し、メインモデルが応答しないようにする、独立したAIシステムとなっている。なお、リリース当初は、生物学および化学関連のほとんどのリクエストに対して、「Fable 5」が「Opus 4.8」にフォールバックするように設定されている。

社内でのテスト結果。「Fable 5」のセキュリティ対策が、以前の一般公開モデルよりも脱獄に対する耐性を高めていることを示している

 なお、“Fable”の訳語としては、寓話・作り話・伝説などが当てはまる。