ニュース

AIの大規模な実運用に向け、NVIDIAとAWSが協力

 NVIDIAとAmazon Web Services(AWS)は、Amazon EC2(Elastic Compute Cloud)全体にわたりAIシステム構築の問題点となる、低遅延の推論や高速なベクトル探索などに対応するべく、GPUの価格性能比に優れたNVIDIAのAI基盤の導入などを通じ、企業が本番規模でAIを導入するためのよりよい環境を提供すると発表した。

 6月より「NVIDIA RTX PRO 4500 Blackwell Server Edition GPU」を搭載したAmazon Elastic Compute Cloud (Amazon EC2) G7インスタンスの一般提供が開始されているが、今後、AI、グラフィックス、ビデオ、データ分析ワークロード向けのコンピューティングレイヤーを拡張していく。

 NVIDIA cuVSライブラリは、デフォルトでGPUによるベクトルインデックス作成を行なうことで、検索レイヤーを高速化。AWSがNVIDIA GB300でNVIDIA Exemplar Cloudステータスを取得したことで、顧客はトレーニングワークロードに最適なパフォーマンスを確実に得られるようになる。

 AWSは、トレーニングワークロード向けNVIDIA GB300において、NVIDIA Exemplar Cloudの認定を取得。これにより、NVIDIAがリファレンスアーキテクチャと比較してAIワークロードのベンチマークを行なう際に用いる、厳格なパフォーマンス基準を、AWSが満たしていることになる。