オンエア素材の人物チェックに顔認識。日テレ参院選報道の現場はAIでこう変わった

このエントリーをはてなブックマークに追加

2019年7月21日に投開票された参院選。山本太郎氏率いる「れいわ新選組」や「NHKから国民を守る党」が議席を獲得するなど、話題が飛び交った選挙戦だった。

テレビでは開票速報によって誰が当選したのかリアルタイムで伝えられた。

日テレで2019年7月21日の地上波で放送された番組「NNN参院選特番 ZERO選挙2019」と「日テレNEWS24×参議院選挙2019」。その裏で、AIの顔認識技術を使った実験が行われた。映像内の人物と名前の間違いによる誤報を防止するための、確認作業の工数を大きく削減させたという。

プロジェクトを指揮した、日本テレビ放送網株式会社技術統括局の加藤大樹さんに話を聞いた。

誤報は人の人生を変えてしまう

参院選からさかのぼること1年前、日テレの技術統括局(社内の放送技術を統括する部署)に所属する加藤さんは最新技術の動向を調査していた。

技術動向を追うなかで、「AI顔認識」という技術の存在を知った。

加藤さんが以前所属していた「CVセンター(送られてくる素材を編集し、オンエア用の映像を作成する部署)」では、オンエア素材に映っている人物が本当に意図したとおりの正しい人物か確認するのに時間と労力がかかること、そしてごくまれに、取り違えて誤報が発生してしまうことが課題だったという。

――加藤
「正確性が命のニュース番組で誤報が起きれば、視聴者からの信頼を失います。それ以上に、誤報の対象となった当事者の人生を大きく変えてしまう可能性もある。その『ごくまれ』をゼロにしたいという思いがありました」

殺人事件の犯人とされた写真がもし間違っていたら? 選挙で当選確実と表示された候補者が、実は違う人だったら?

すべての誤報がこのような深刻なケースではないものの、どうしてもまれに発生してしまうことがあったという。

参院選を想定し準備。紙資料で人物の顔と名前と照らし合わせる作業が大きな負荷に

加藤さんは誤報を削減する手段としてAI技術が使えるのではないかと思いつき、実験の場として、1年後に予定されていた参院選の報道を想定し準備を始めた。

――加藤
「選挙特番を選んだのは、テレビ局の番組の中でも最高ランクの正確性と迅速性が求められる番組であり、AI顔認識の効果を検証する場としてふさわしいと考えたからです」

CVセンターと呼ばれる、世界各地からの伝送素材を収録する場所。スタッフが画面を見て目視で素材をチェックしている

――加藤
「リアルタイムの会見などで人違いが起こると大変なことになるわけです。スタッフ一同、血眼になって画面を睨みつけ、間違いがないかチェックしています」

現場では編集スタッフ以外にも、ベテラン記者やディレクターなど100名体制で映像制作を行い、間違いが起きないよう二重三重にチェックをしている。

チェックの際は画面を目視し、オンエアされる人物の顔と名前をチェックする。名前と顔を紙資料にまとめておき、それを参照してチェックしたり、人物が所属する事務所のサイトを検索して調べたりなど、膨大な負荷がかかっていた。

選挙には多くの候補者がいる。有名な候補者ならまだしも、マイナーな候補者であればあるだけ参照には時間がかかる。ましてや報道現場は戦場のように忙しい。一刻も早く映像をオンエアしたいが「誤報を防ぐための確認作業の時間を減らすわけにはいかない」というジレンマがあった。

顔認識を活用し、オンエア率は2倍近くアップ

では、AIによる顔認識を活用することでどのような効果が得られたのか。

――加藤
「結論から言えば、オンエア素材チェックでの運用において、AIの認識には一度の間違いもなく、オンエア中の誤報は0件でした

その結果、各工程での紙資料によるダブルチェック作業も必要なくなり、確認速度が向上。素材チェックの時間が激減したため、より多くのVTRをオンエアできるようになった。

たとえば「バンザイ映像(候補者が当選した際に事務所でバンザイをする映像)」を前回の選挙で83本のVTRを作成し、チェックが間に合いオンエアに至ったのは約30本(オンエア率36%)だったのに対し、今回は54本作成のうちオンエアに至ったのは34本(オンエア率62%)と、2倍近い高確率でオンエアすることができたという。

顔認識を行っている9面マルチ(素材チェック用の画面)

認識精度については、当日は50名近くのスタッフがこのシステムを利用したが、AIによる顔認識の間違いは見つけられなかったという。

後に行われた定量的な検証の結果、AIによる顔認識作業の精度は99.74%であることがわかった。一般的に、人間による顔認識作業の精度は97%程度のため、人間を上回ったことになる。

これにより、これまで画面を見て人物の顔と名前を照合する作業専任だったスタッフを、1名削減できたという。

――加藤
「人間では紙資料やwebを使っての人物確認作業に20~30秒かかります。AIは1秒以内で行うことができ、迅速に編集作業にとりかかれたので、スタッフもその分人間しかできないことをしてもらうことにしました」

削減した人員は、ネットワーク局との電話でのコーディネーション業務に移ってもらったという。

当該業務では、素材をネットワーク局に依頼したり、送られてくる素材の情報のやりとりを行うポジションで、コミュニケーションが発生する。文字通り「人間でしかできない」仕事だ。

ベンダーとの認識すり合わせに苦労。現場へ招くことも

参院選報道の現場で使われたAIは、こうして誤報防止のための確認工数削減に多大な貢献をした。

仕組みとしては、すでに学習済みの顔認識AIに対して、認識させたい人物の画像を一枚、辞書として登録することで認識することが可能だという。

取材時にデモを見せてもらったが、人物の重なりがあってもある程度認識し、目や鼻、口など顔のパーツが写っていればほぼ認識に成功していた。

この顔認識システムは、あるひとつのベンダーに依頼し、作り上げたという。ベンダーとのコミュニケーションの話を聞くなかで、AI担当者の苦労が垣間見えた。

――加藤
「今回のシステムを作り上げるなかで10社以上にお声がけし、こちらが求める基準に達するか、性能評価を行いました」

性能評価には数ヶ月をかけ、社名は出せないが日本における規模の大きいベンダーはひととおり声をかけたという。そのなかで、今回選定されたベンダーの決め手はなんだったのか。

――加藤
「やはり認識精度の高さですね。ただ、今回はうまくいきましたが、課題感のすり合わせには苦労しましたね」

テレビ放送では、放送中のキャプションに誰が映っているのか、わかりやすく表示することが重要だ。そのため、顔認識システムにおいても、一回人物を認識したら画面の外に出るまで認識し続けてもらう必要がある。

しかし、ベンダーが提示するソリューションは、最初の段階ではその「認識しつづける機能」に対応していなかった。そこで加藤さんは、なぜその機能が必要なのかを理解してもらうため、実際にニュース番組制作の現場にベンダーを招き、丁寧に認識をすり合わせていったという。

――加藤
「プロジェクトではフェーズをふたつに分けました。ひとつはいわゆるPoCで、性能がわかるようなデモを作ってもらい現場のスタッフに見せ、フィードバックをもらう作業を繰り返しました。

私も、こういう作業をするからこの機能が必要で、だからこんなインターフェースが必要なんだと逐一説明していきました」

そしてPoCの次のフェーズとして、今回の参院選の実験があるという位置づけだ。

今回の実験では、本当に現場で使えるものを作ることを目指し、うまくいけば本格導入するという狙いがあった。そのため、ベンダーとのやりとりでは「本当に必要なものとのブレをなくすのに苦労した」と加藤さんは語る。

決裁者を説得するには「とりあえず動くデモ」

AI担当者の「苦労あるある」が、社内の説得、とりわけ決裁者と現場の説得だ。

決裁者からはROIを厳密に求められ、現場からは本当に業務での使用に耐えるのか懐疑的な目で見られる。実際、加藤さんも同じ立場だったという。

――加藤
「PoCに入る前は『本当にAIなんて使えるのか』という声が一定数ありました。間違ったら大変なことになるから機械に任せるのは不安だと。

しかし、PoCで精度が出ると社内にいい意味で驚きの声が広がり、流れが変わりました。人間より精度高いじゃん、AIってすごいねと言ってもらえたのはうれしかったですね」

加藤さんが以前は編集スタッフを務めており、現場の業務を知っていたのも大きいだろう。現場の課題を理解しており、加藤さんが言うのなら課題は間違いなくあるのだろう、と決裁者の信頼を獲得した。

加藤さんは、決裁者を説得するには、「とりあえず動くデモ」もしくは「動画」が有効だと語る。口で説得しても理解してもらうのに時間がかかる。実際に動くものを見せるのが一番有効だという。

今後は選挙戦以外の番組へもシステムを展開

今後の展開として、加藤さんは社内へのシステムの横展開が必要だと語る。

――加藤
「選挙以外にも、人物の顔と名前を一致させる必要がある番組は無数にあります。スポーツ番組や芸能番組などにも顔認識を使えるようにしていきたいですね」

顔認識データベースの更新も課題だ。データベースに登録していない人物は認識できないため、新しい人物を登録しつづける必要がある。登録時に間違えてしまえばその後永久に間違えることになるため、正確性を担保する仕組みを作る必要もある。

最後に、現場のスタッフが挙げたという、顔認識を活用したデメリットが興味深いので紹介したい。

――加藤
「AIが名前と顔を照合してくれるので『人の顔を覚えなくなりそうで怖い』という声がありました。

現状、記者などその人物と直接会って話す可能性のある職種はもちろん覚える必要があると感じますが、もしAI技術が普及すれば、映像を見てチェックするだけの職種の人が覚える必要はないと思います。そもそも一部のベテラン以外には、人物をAIほどの精度で判別するのは不可能なので」

その仕事は本当に人間がやる必要があるのか? 普段の業務を見直してみることから始めてもいいかもしれない。