TBSテレビ、AIと人間による文字起こしサービスを一般提供 時間を半分以下に

このエントリーをはてなブックマークに追加


株式会社TBSテレビは9月23日、同社が開発する人工知能(AI)音声認識技術を使った文字起こしエディタ「もじこ」を吉積情報株式会社にライセンス提供し、一般企業に販売開始したと発表。

テレビやラジオ業界では日々、文字起こしが多く発生する。しかし、非常に手間のかかる作業であるため、番組制作の現場では大きな負担になっていたという。TBSテレビは文字起こし作業を少しでも減らすために、「もじこ」を開発したとしている。

音声認識率100%は無理 文字起こしの時間を約半分以下に

TBSテレビは「もじこ」の開発にあたり、どれほど技術が進歩しても音声認識率が100%ではないことに着目。最新のAI音声認識エンジンを活用し、取材した音声・動画ファイルなどの素材を自動で文字起こしした後、人間が正しく認識されていない文章をすぐに「修正・編集」ができるように開発した。

具体的には、長時間録音・録画されたファイルでも、すべてがテキスト化されるのを待つことなく、テキスト化が終わったところから聞きたい場所だけを繰り返し再生して修正できる。番組制作の現場での利用を前提に、タイムコードとの連携・サムネイル画像の表示・話者の設定・メモの挿入などの機能も搭載しており、誰でも直感的に簡単に操作できるという。

これらの取り組みにより、TBSテレビでの利用実績をベースとした検証では、通常人力のみの文字起こしには素材の約6~10倍の時間がかかるところ、「もじこ」を利用することで素材の約3倍程度と、時間を約半分以下に抑えられたとのこと。

世界125以上の言語に対応

また、同サービスはAI音声認識エンジンを、日本語の文字起こしに特化した「AmiVoice」、世界125以上の言語に対応する「Google Cloud Speech to Text API」の2つから選択できる。

なお、同サービスはクラウド上で提供されるソフトウェア「SaaS(Software as a Service)」として提供する。インターネットを経由してアクセスできるため、ユーザーはソフトウェアをインストールする必要がない。インターネット環境があればオフィスだけではなく、自宅や外出先からもアクセスし、テレワークやリモートワークなどでも活用できる。さらに、機能のアップデートも随時自動で実施される。

>>ニュースリリース

オンライン会議の音声をAIが自動翻訳 リアルタイム文字起こしでグローバル化に貢献

近年、AIを活用した文字起こしサービスが注目を集めつつある。

最近でも、株式会社ObotAIは9月9日に、AIチャットボットを導入した企業・自治体に向けて、オンライン会議の音声をAIが自動翻訳し、リアルタイムで文字起こしする「ObotAI Minutes」を10月1日から無償提供を開始すると発表した。

新型コロナウイルス感染症(COVID-19)感染拡大の影響を受け、多くの企業がリモートワークを導入している。中でもオンライン会議は場所を選ばず対話できるため、活用がますます広がっている。オンライン会議は国内外問わずに対話できることが大きなメリットであるが、そこには言語の壁がある。

ObotAIは、オンライン会議活用によるコミュニケーションの円滑化ともに、企業の国際化・多様化にも対応したいという思いから、多言語AIチャットボット「ObotAI」や、多言語翻訳「MyPhone訳」で開発した多言語翻訳技術を活用し、オンライン会議の音声を自動翻訳可能な「ObotAI Minutes」を開発した。

「ObotAI Minutes」の主な機能は3つある。100言語以上に対応し、外国人スタッフとのミーテイングや国際会議をスムーズに実現する「自動翻訳機能」。AIがオンライン会議中の音声の文字起こしを実施し会議内容をリアルタイムで記録・確認できる「AI文字起こし」。そして、文字起こしをしたデータを議事録としてダウンロードし、多言語翻訳することで、議事録をまとめる作業を削減し、業務効率アップにつながる「多言語議事録作成」だ。

ObotAIは、リモートワークの普及によって今まで以上にさまざまなモノ・コトがオンライン化する中で、今後は「ObotAI Minutes」を用いて事業のさらなるグローバル化を目指すという。