ソニー、TBSテレビにAI字幕システムを提供 作業を3人程度から1人に削減

このエントリーをはてなブックマークに追加

ソニーグループのソニービジネスソリューション株式会社は11月12日、株式会社TBSテレビに、音声解析AI(人工知能)を活用して、テレビ字幕を自動的に生成するシステム「もじぱ音声認識テキスト化システム(もじぱ)」を納入したと発表。地上波の報道番組などで活用される予定という。

システム概要

「もじぱ」は、自社開発のAI音声認識システムと、TBSの字幕システムを連携し、音声からリアルタイムで自動的に字幕を生成する。担当者は生成された字幕をディスプレイ上で確認し、必要に応じて内容を微調整するだけで、番組に字幕を付けられるという。

ソニービジネスソリューションが培ってきたAIや音声解析技術を活用することで、報道番組に特有な時事用語や人名などを事前に登録し、字幕として認識させることも可能だ。

本システムは2019年10月から、新しい単語の学習効果や音声認識の精度を高めることを目的に、ソニービジネスソリューションとTBSが共同で実証実験が進めてきた。約1年間の実証実験では、これまで1時間未満の番組につき3人程度必要だった字幕起こしの人員を1人に削減できたとする。また、TBSの計測によると、音声認識の精度は95%以上を実現したとのこと。

実証実験での結果、放送局におけるワークフロー改善に効果が高いと認められたことから、正式なシステムとして採用されたとしている。

今後はバラエティー番組のような、複数の話者がいる場合でもスムーズに字幕起こしができる仕組みを取り入れるなど、報道番組以外の幅広い放送での活用を目指すとした。

>>ニュースリリース

TBSテレビ、AIと人間による文字起こしサービスを一般提供 時間を半分以下に

TBSテレビは「もじぱ」と名称が似ているが、「もじこ」というサービスを提供している。「もじこ」とは、同社が開発するAI音声認識技術を使った文字起こしエディタだ。同社は9月23日に、吉積情報株式会社に「もじこ」のライセンス提供し、一般企業に販売開始したと発表した。

TBSテレビは「もじこ」の開発にあたり、どれほど技術が進歩しても音声認識率が100%ではないことに着目。最新のAI音声認識エンジンを活用し、取材した音声・動画ファイルなどの素材を自動で文字起こしした後、人間が正しく認識されていない文章をすぐに「修正・編集」ができるように開発した。

TBSテレビでの利用実績をベースとした検証では、通常人力のみの文字起こしには素材の約6~10倍の時間がかかるところ、「もじこ」を利用することで素材の約3倍程度と、時間を約半分以下に抑えられたとのこと。