大規模言語モデルでホワイトカラーの仕事はこう変わる。Gunosyが動画要約AI機能を実装した理由

このエントリーをはてなブックマークに追加

LLM(Large Language Model……大規模言語モデル)が活況だ。2022年に発表されたOpenAIの大規模言語モデルを用いたチャットサービス「ChatGPT」に始まり、2023年2月にはGoogleの「Bard」、3月にはOpenAIからGPT-4も発表され、にわかに“LLM旋風”が巻き起こっている。

そんな中、2月4日に株式会社Gunosyが発表したのが、ニュースアプリであるグノシー内での動画要約AI機能だ。グノシーに新設された「注目動画AI要約(β版)」タブでAIによって要約された記事を見ることができ、元動画を見たい場合は記事内のリンクから動画へ遷移できる。この機能にはOpenAIが提供しているGPT-3のAPIが使われているという。

なぜこの時期に本機能を実装するに至ったのか。あわせて最近のLLMの盛り上がりについて、Gunosy執行役員の久保光証氏に聞いた。

株式会社Gunosy 執行役員/Gunosy Tech Lab 室長 久保 光証 氏

東京工業大学大学院総合理工学研究科修了。2013年当社へ新卒入社。メディアプロダクトの配信アルゴリズム開発・データ分析や広告配信アルゴリズム開発・データ分析を担当。2020年8月より執行役員。

ChatGPTがすごいのは“普通の人”でも使えること

── 久保
「ChatGPTが革命的なのは、アプリケーションとして触りやすく、普通の人でも手軽に使えてしまうことです。一部の研究者だけでなく社会的な一大トレンドとなっているのは、その点が大きいと思います」

昨今のLLM周りの盛り上がりについて聞くと、久保氏はこう答えた。

久保氏によれば、プログラミングという行為は“ChatGPT向き”だ。ニュースなど、事実に関する質問をするとChatGPTは嘘をつくこともあるが、プログラミングではコードが間違っていればエラーが出て動かない。

── 久保
「現在我々がPCを用いて行っている作業は、すべてがテキストによって成り立っていると言っても過言ではありません。ChatGPTはその扱える問題の多さから、すべての業界でホワイトカラーが主に担っているテキストを介した業務は置き換えられる、もしくは効率が爆発的に上がると思っています」

たとえば、Githubにもコメントを書くと内容になったコードを提案するアシスト機能がある。現在はアップされるコードの40%がこのアシスト機能を用いて書かれており、AI機能の強化で80%にまで上がるだろうとCEOも発言している。久保氏も、この流れがLLMによってさらに加速するだろうと語る。

── 久保
「プログラマーやライターといった仕事のあり方は大きく変わります。今後数年で人間の仕事はこの表現で外に出していいのかを判断するなどのレビューに置き換わるだろうと思います。少なくとも、定形作業はほぼ間違いなく置き換わっていくでしょう。改めて、人間の仕事とは何かを問い直す必要があります」

LLMを活用して要約技術を加速させる。動画要約AI機能リリースの背景

Gunosyにはもともと、Gunosy Tech Lab(以下テックラボ)という研究機関を有し、その中にR&Dというチームが存在する。Gunosy社内のデータとアルゴリズム開発を統括しており、加えて先端技術の研究開発も行っている。その中で、LLMを含めた自然言語処理分野の研究開発も進められていた。

そのひとつが、LLMを活用した要約技術のプロダクトへの組み込みだ。

── 久保
「テックラボ内でLLMを活用したニュースの要約機能も以前から検討していました。要約技術自体は昔からあるものですが、昨今の機械学習技術の発展で要約の精度も飛躍的に上がり、一気に現実的になってきたのです」

そこで、試験的に今回リリースされた動画要約AI機能の検討をスタート。もともとLLMの研究開発をしていたテックラボの存在も後押しし、動画要約AI機能は構想からわずか1ヶ月ほどで実装に至ったという。

▲動画要約AI機能のイメージ

そもそもこのタイミングで同社が動画要約AI機能をリリースしたのはなぜなのか。それはLLM旋風に乗るという理由に限らない。「情報を世界中の人に最適に届ける」というミッションを掲げる同社では、要約技術自体は長年研究されてきた分野のひとつでもある。

── 久保
「まさに当社のミッションに合致するからです。50歳の教授と20歳の学生では、同じ情報でも、文体や単語のバリエーションなど、情報の渡し方によって伝わり方は違います。たまたまGPT-3を始めとしたLLMが有効であるため活用しているだけで、たとえそれがなくとも、すべての人にわかりやすい形で情報を届けるために研究するのは変わりありません」

まだ“第一弾”。今後さらなるLLM活用を推進

動画要約AIには、ChatGPTの前身にあたるGPT-3のAPIが使われている。そして、3月1日にはChatGPT自体のAPIも公開された。

── 久保
「ChatGPTのAPIはコストが大きく下がり、API費用も1/10程度になることもあり、もちろん活用を検討しています。また、GPT-4が3月に発表されたこともありますし、GPT-3と精度は同程度で軽量なモデルもどんどん出てきています。色々と試しながら最適な言語モデルを見極めたいと思っています」


動画要約AI機能については、CTRのみならず、アプリの滞在時間や定着率、離脱率といった複数の数字を見つつ、β版以降の作戦を練っているそうだ。とはいえ、グノシーで動画をまったく扱わなくなることもないという。

── 久保
「この機能が仮に失敗に終わったとしても、動画に関するなんらかの施策を検討していくことになるでしょう。これまでもYouTubeの動画を見られる機能はありましたが、動画を並べて見せるだけにとどまれば、グノシーで動画を見る価値たりえません。グノシーユーザーにとって最適な動画の見せ方とは何か、これからも追求していきます」

同社によれば、動画要約AI機能は、LLM活用の取り組みの第一弾に過ぎないという。今後同社がLLMを活用してどうニュースの届け方を変革していくのか、今から楽しみでならない。