ニュース

NVIDIA、オープンなマルチモーダルモデル「Nemotron 3 Nano Omni」発表

 NVIDIAは、視覚、音声、言語といったエージェント型ワークフローの機能を1つのシステムに統合したオープンマルチモーダルモデル「NVIDIA Nemotron 3 Nano Omni」を発表した。

 これまでの視覚、音声、言語それぞれに個別のモデルを使用していたAIエージェント型システムは、モデル間でデータを受け渡す際に時間がかかったり、文脈が失われたりしていた。「NVIDIA Nemotron 3 Nano Omni」ではモデルを統合することで、ビデオ、オーディオ、画像、テキストなどさまざまなデータに、より高速でスマートに応答でき、高度な推論を実現できるようになった。

「NVIDIA Nemotron 3 Nano Omni」は、他のインタラクティビティを持つ他のオープンオムニモデルと比較して9倍高いスループットを実現。低コストで高度な精度を実現しており。オープンなマルチモーダルモデルの効率性をこれまでより一段高めている。

 対象ユーザーは、マルチモーダル知覚サブエージェントを必要とする、信頼性の高いエージェント型システムを構築する企業および開発者を設定。アーキテクチャは、30B-A3BハイブリッドMoE(Conv3D、EVS、256K コンテキスト搭載)。