ニュース

OpenAI、「GPT-5.6」シリーズ「Sol/Terra/Luna」の限定プレビューを開始

7月には一部の顧客向けに「GPT-5.6 Sol」を提供予定

 OpenAIは、米国政府との継続的な連携の一環として、次世代AIモデル「GPT-5.6」シリーズの政府に協力を表明した少数の信頼できるパートナーグループを対象とした限定プレビューを開始した。このシリーズは最上位のフラッグシップモデル「Sol」、日常業務向けの「Terra」、高速かつ手頃な価格の「Luna」で構成されている。料金は、100万トークンあたり入力が5ドル、出力が30ドルに設定されている。これらのモデルは、今後数週間以内に一般公開する予定としている。

 GPT-5.6では、推論を深くする時間を最大限に確保するために「max reasoning effort」という新たな機能を導入。さらに、単一のエージェントの能力を超え、サブエージェントを活用して複雑なタスクを加速させる「ultraモード」が追加されている。

 各分野の評価において、コマンドラインのワークフローをテストする「Terminal-Bench 2.1」では、GPT-5.6 SolのUltraモードが91.9%のスコアを記録。長期的なゲノミクスなどを評価する「GeneBench v1」では、前世代のGPT-5.5よりも少ないトークン数で高い成果を示している。

Terminal-Bench 2.1
GeneBench v1

 サイバーセキュリティの領域でも効率向上が見られ「ExploitBench」では、競合モデル「Mythos 5」や「Mythos Preview」などとの比較で、約3分の1の出力トークン数で同等水準のタスクを処理した。

ExploitBench

 GPT-5.6のプレビュー版では、モデルごとに異なる詳細な設定を用いた多層的なセキュリティ対策を採用し、実際の攻撃を想定した負荷テストを実施。これには、生成中に動作するサイバーおよび生物学分野の悪用分類器が含まれており、リスクの高いケースでは大型の推論モデルが文脈を再審査する仕組みとなっている。

 また、7月にはCerebras上で一部の顧客向けに、GPT-5.6 Solが最大750トークン/秒で提供される予定となっている。