ニュース

NTTのLLM「tsuzumi 2」、図表付きの文書の読み取りに対応

tsuzumi 2 Visionモデル

 NTTは5月19日、同社が開発するLLM(大規模言語モデル)「tsuzumi 2」をビジョンベースの処理に対応させた「tsuzumi 2 Visionモデル」を発表した。

 これまでtsuzumi 2は文字ベースの情報処理に対応するLLMとして提供されてきたが、業務に用いられる文書の多くは人間が読むことを前提とし、表組みされていたり、グラフ化されていたりすることが多い。

 今回のバージョンは、こうした図表付きの日本語文書を高精度で読み取ることを可能にしたもの。企業ごとにフォーマットがバラバラな見積書などの書類や、業務フローを定義するフローチャートを読み取って理解し、ユーザーのリクエストに回答できるようになっている。

 同社では、新モデルはNTTグループ各社を通じて順次サービスとして提供されるほか、さらなる進化に向けた研究開発を推進していくとしている。