ニュース

画像解析サービス「ProTech AI-OCR」でLLMを活用した次世代マスキング技術の実証実験

 ショーケースは、画像解析サービス「ProTech AI-OCR」で、大規模言語モデル(LLM)を活用した高精度マスキング技術の実証実験を開始した。

 同サービスは、免許証などの身分証明書や名刺、レシートなどのほか、申請書や問診表といった手書きされた文字といった、あらゆる画像の文字情報を99%以上の制度で読み取り、テキスト化できるサービス。これまで手作業で行なっていた入力作業を自動化し、業務時間とコストを削減できる。

 従来は、マスキング精度が十分でないケースに対して、新たなパターンを個別に学習させることで精度向上を図っていた。ただし、自治体や企業ごとに形式が異なる書類フォーマットや、文脈を踏まえた情報判定が求められるケースでは、従来の学習型OCRでは対応が難しいという課題があった。

 この課題を解決するため同社では、大規模言語モデル(LLM)を活用し、文脈理解に基づいて情報を特定・マスキングする新たな技術の研究開発を推進してきた。その結果、従来の手法では対応が難しかった非定型書類でも、高い精度でのマスキングが可能となり、書類の形式や画像の品質に依存せず、幅広い情報を自動的にマスキングできる技術を実現した。

 現在同サービスは、一部の自治体で「クレジットカード番号」をマスキングする目的で試験的に導入されており、業務効率化および情報管理の高度化に向けた検証を進めている。