ニュース

NVIDIA、ローカルAIの実現に向けDiffusionGemmaとの親和性をアピール

 NVIDIAは、GoogleのAI研究開発チームが開発したオープンモデル「DiffusionGemma」を最適化し、ローカルPCからクラウドまで、NVIDIA GeForce RTX GPU、NVIDIA RTX PROプラットフォーム、NVIDIA DGX Sparkシステムで、さらに高速に動作するようにしたと発表した。

 DiffusionGemmaは、Gemma 4をベースに構築されており、トークンを一度に1つずつ予測するのではなく、1ステップあたり最大256トークンのノイズを除去。このパフォーマンスの向上により、シングルユーザーによる生成が通常失速してしまうような場合でも、ローカルのハードウェア上での高速なテキスト生成を実現する。

 256トークンブロック全体をTransformerで並列処理するということは、NVIDIAのGPUの設計に合致しており、NVIDIA Tensorコアは高密度な並列演算を高速化し、CUDAソフトウェアスタックは特別な調整をせずともモデルの効率的な実行を可能とする。DiffusionGemmaの設計はNVIDIAのGPUのメリットを生かし、効果的に処理を行なうとしている。

 これにより、NVIDIA DGX SparkやNVIDIA RTX PRO 6000ワークステーション、DGX Stationなどで、ローカルAIを最適に行なうことが可能としている。

 なお、ローカル環境でのオープンソースの推論エンジンllama.cppの、GeForce RTX GPUでのサポートも近日予定となっている。