ニュース

リコー、日本語ドキュメントのLLM読解性能を向上させるワークフロー

「Dify」のテンプレとして「RICOH オンプレLLMスターターキット」に搭載予定

 リコーは、図表や複雑なレイアウトを含む日本語ドキュメントでのLLMの読解性能を向上させる「ドキュメント読解強化ワークフロー」を開発した。同技術は、今夏から生成AIアプリ開発プラットフォーム「Dify(ディフィ)」のテンプレートとして「RICOH オンプレLLMスターターキット」への搭載を予定している。

開発の背景

 生成AIの急速な普及に伴い、日本企業では企業内ドキュメントの高度な活用を目的としたAI需要が高まっている。企業内には、請求書や経営資料、マニュアルなど多様なドキュメントが蓄積されていますが、これらには図表や画像も含まれるため、従来のテキスト検索では十分に活用できないという課題がある。

 また、セキュリティやプライバシー、ガバナンスの観点から、オンプレミス環境や自社データセンターでAIを活用したいというニーズも高まっている。同社は、こうした企業ニーズに応えるため「RICOH オンプレLLMスターターキット」を開発し、順次機能強化を進めていく。

同ワークフローの特徴

図表読解性能を向上させるドキュメント解析処理

 図表や複雑なレイアウトを含むドキュメントから、テキスト、図、表などの情報を効率的に抽出するドキュメント解析処理技術を採用。これにより、本文と図表の関係性を踏まえた回答生成が可能となり、従来の方法に比べて、ビジネスドキュメントの読解精度が向上する。

ドキュメント解析処理の概要

Self-MoAによる高効率な推論プロセス

 同一LLMから生成される複数の回答候補を統合する「Self-MoA(Self Mixture-of-Agents)」を採用。この技術により、複数LLMを組み合わせる従来の「MoA(Mixture-of-Agents)」方式に比べ、GPUリソースを効率的に活用しながら、回答品質の向上を実現した。

MoA方式とSelf-MoA方式の比較

柔軟なLLM選択が可能

 同ワークフローは、合わせて利用するLLMを自由に選択することができる。クラウド・オンプレミス双方の環境で利用でき、大型商用モデルとの併用にも対応。LLMに対する追加学習などは不要なため、随時、最先端モデルと合わせて活用するなど、顧客の要望に応じた柔軟な運用が可能である。

Difyテンプレートとして「RICOH オンプレLLMスターターキット」に搭載

 同ワークフローは、図表を含む日本語ドキュメント理解における AI の推論(リーズニング)性能を評価するベンチマークツール「JDocQA Reasoning Benchmark」を用いて評価を実施した。その結果、図表を含む日本語ドキュメント読解性能が向上することを確認している。

ドキュメント読解強化ワークフローの全体像
【「JDocQA Reasoning Benchmark」評価結果】