ニュース
NTT、LVLM出力の信頼性を高める新たな仕組み「根拠強化デコーディング」
2026年6月1日 19:02
NTTは、画像と言語を扱うマルチモーダルAI基盤モデルによる出力の信頼性を高める新たな推論の仕組みとして「根拠強化デコーディング」技術を確立した。
同技術は、大規模視覚言語モデル(LVLM)が段階的な思考による推論(Chain-of-Thought、CoT)を実行する際、根拠と結果が一貫しないという重大な課題を発見。この課題に対し、画像の情報を維持しながら根拠の情報を最大限活用する理論的な枠組みを導入することで、推論時に任意のLVLMの出力を画像と根拠の双方に忠実に依存させるものだ。
同技術により、ブラックボックスだったLVLMを追加の学習コストなしで説明可能AI(eXplainable AI)として運用でき、ビジネスでの意思決定やAIエージェントとの連携による複雑な課題解決といった、高い信頼性が求められる幅広いユースケースへの応用が期待できる。
なお同研究成果は、6月3日から7日まで開催されるコンピュータービジョン分野における最難関国際会議「CVPR 2026」(Computer Vision and Pattern Recognition)で発表される。












































