ソニー、TBSが採用のリアルタイム字幕生成システム「もじぱ」にAI音声認識システムを提供

このエントリーをはてなブックマークに追加

ソニーマーケティング株式会社は5月20日、株式会社TBSテレビが株式会社トラフィック・シムを通じてテレビAIリアルタイム字幕生成システム「もじぱ」の販売を開始するにあたり、同システムへのAI音声認識システムの提供を開始した。

「もじぱ」は、ソニーマーケティング開発のAI音声システムとTBSの字幕システムを連携し、音声からリアルタイムで自動的に字幕を生成する。

速記担当者は生成された字幕を「もじぱ」のディスプレイ上で確認し、必要に応じて内容を微調整するだけで、間違いのない正確な字幕を番組に付与できる。

今回提供を開始したAI音声認識システムは、主に報道番組での活用に適した音声解析技術を採用しているほか、日本語に対する高い認識精度が特徴だ。BGMや他の音源が被っている音声でも、問題なく認識できるという。

2019年10月から1年間、TBSとシステムの有用性を検証する実証実験を実施し、96%以上の認識精度(※)が実証されたことから、2020年11月にTBSで正式に採用されている
※実証実験における認識精度。実際のシステムでは、環境や字幕内容によって精度は異なる

「もじぱ」システム概要

「もじぱ」の主な特徴は以下のとおり。

字幕生成の省力化とコスト削減:
「もじぱ」は、入力された音声をAIが解析し、リアルタイムで自動的に字幕を生成する。これまで、リアルタイムでの字幕生成においては、特別なスキルを持つ速記者数名が対応する必要があったが「もじぱ」を活用することで、担当者はディスプレイに表示された字幕の正誤を確認し、微調整するだけで字幕を生成できる。

高い音声認識精度と実現:
ソニーマーケティングが独自に開発したAI音声認識システムを組み込むことで、95%以上の高い音声認識精度を実現した。

直感的なUIによる高い操作性:
スピーディーな操作が求められるリアルタイムでの字幕生成をサポートするため、タッチパネルによるUIを搭載。ディスプレイ上の文字をタッチするという直感的な操作で、自動生成された字幕の修正と創出ができる。

「もじぱ」画面イメージ

>>ニュースリリース