ニュース

リアルタイムAI音声翻訳ソリューション「DeepL Voice」とは?

 DeepLジャパンは4月2日オンライン説明会を開催し、リアルタイムAI音声翻訳ソリューション「DeepL Voice」の優位性をアピールした。

 DeepL Voiceはリアルタイムに翻訳し文字起こしをしたり、リアルタイムに話した言葉を翻訳し音声で出力してくれる。同社は多国籍企業のビジネスの現場において、多国籍企業の会議時間の約3分の1が言語の壁で損失しており、さまざまな言語が飛び交う会議での参加者が60%しか理解できておらず、認識のズレや誤解、確認作業の増加による生産性の低下などが発生していると説明。

多国籍企業のビジネスの現場では言語の壁が存在している

 DeepL Voiceには、バーチャル会議リアルタイム翻訳ソリューション「DeepL Voice for Meetings」と、対面でのリアルタイム翻訳モバイルソリューション「DeepL Voice for Conversations」が用意されている。いずれも言語分野において高い専門性を有することから翻訳精度も高く、またユーザーの同意なく翻訳時のデータは保存されず、翻訳のディープラーニングの学習などにも使用されないなど安全性を担保している。

 DeepL Voice for Meetingsは、バーチャル会議向けのAI字幕翻訳で、話したその場で翻訳しながら文字起こしを行なってくれる。Microsoft TeamsおよびZoomMeetingsに対応し、同時に5言語への翻訳を行ない表示してくれる。入力音声は英語、日本語、標準中国語、韓国語など18言語で、出力字幕はDeepL 翻訳が対応する100以上の言語となる。

DeepL Voice for Meetings
説明会で行なわれたデモ映像。自然に翻訳され、聞き取りやすい言葉で翻訳された言葉が再生されていた

 DeepL Voice for Conversationsは、スマートフォンのソリューションで、話者の言語を自動検出し、リアルタイムに翻訳し、翻訳音声を自動再生したり、AIによる字幕翻訳をリアルタイムに表示してくれる。対面で話したときに使いやすいように、スマートフォンの画面を半分に分割し、話者と話者の間でやりとりしやすいようなインターフェイスも備えている。入力音声は18言語で、出力字幕は30以上の言語となっている。

 説明会ではデモンストレーションを行なっていたが、翻訳も自然で、翻訳した音声も聞き取りやすく、母国語でやりとりしているように感じた。またDeepLは、単に翻訳するだけでなく、WORDやPDFなどのフォーマットを壊さずに翻訳してくれるなど、ビジネスの現場で親和性が高いソリューションとなっている。カスタマイズ性も高くユーザーの会社の独自の言葉を辞書登録することでより利便性の向上を図ることもできる。

DeepL Voice for Conversations
さまざまなモードが用意されているが、その1つの対面モードの画面。発言者と対話者の真ん中にスマートフォンを置いて、双方が使いやすいインターフェイスとなっている