ニュース

Anthropic「Claude Sonnet 5」をリリース

よりリーズナブルで、計画立案やツールの使用など自律的動作に優れる

 Anthropicは現地時間の6月30日、「Claude Sonnet 5」をリリースした。同モデルは自律的に動作するよう設計されており、例えば計画を立てたり、ブラウザや端末などのツールを使用したりすることが可能。数か月前までは高価なモデルでしか実現できなかったレベルの自律動作を行なうことが可能という。

 Claude Sonnet 5は、すべてのプランで利用可能。FreeプランとProプランではデフォルトモデルとして提供され、Max、Team、Enterprise のユーザーも利用可能。

 Claude Sonnet 5の性能はOpus 4.8に匹敵するが、価格は低く設定されている。そして、推論やコーディング、そしてツールの使用などエージェント性能を発揮するときに必要な動きにおいて、Sonnet 4.6から大幅に改善されている。

 Claude CodeおよびClaude Platformでも利用可能で、Claude Platformでは、8月31日まで、入力トークン100万個あたり2ドル、出力トークン100万個あたり10ドルの導入価格が設定されている。その後は入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドルとなる。

Sonnet 5の評価項目におけるスコア。比較対象は、Sonnet 4.6およびSonnet 4.8

 同社の安全性評価の結果、Sonnet 5はSonnet 4.6よりも、異常な動作の発生率が全体的に低く、エージェント環境においてより安全に使用できるという。また、Sonnet 5は、サイバーセキュリティ関連のタスクを実行する能力においては、Opusモデルよりも低いという特徴があるという。

 テスターによるテストによれば、これまでのSonnetモデルでは途中で停止していた複雑なタスクでも、Sonnet 5では完了することができるようになったという。また、はっきりと指示されなくても自身の出力をチェックするという。

 開発者はClaude APIclaude-sonnet-5を介して利用することができる。

コストパフォーマンス曲線。Sonnet 4.6はOpus 4.8にくらべ大きく劣っていたが、Sonnet 5は場合によってはOpus 4.8の機能レベルに匹敵する