東京大学松尾研発のELYZA、約6秒で日本語の文章を生成できる大規模言語AIを用いたデモサイト公開

このエントリーをはてなブックマークに追加

東京大学松尾研発のAI(人工知能)スタートアップである株式会社ELYZA(イライザ)は3月28日、キーワードから約6秒で日本語の文章を生成できる大規模言語AIの開発に成功したと発表した。本モデルを用いた文章執筆AI「ELYZA Pencil(イライザ ペンシル)」をデモサイトとして一般公開している。

ELYZA Pencilはキーワードを数個入力するだけで、約6秒で日本語のタイトルや文章を自動生成する文章執筆AI。ELYZA独自の大規模言語AIを用いることで、高精度な生成型の文章執筆を可能にする。今回の一般公開デモではニュース記事、ビジネス用のメール、職務経歴書の生成機能を提供した。

同社はELYZA Pencilによる文章生成の速度や精度を評価するため、選定したキーワードを用いて「速度」「流暢性」「正確性」「キーワード含有率」といった観点でAIと人間(東大生)の執筆について比較検証をした。

その結果、ELYZA Pencilの執筆平均速度は6.4秒(※)で東大生の作業時間の56分の1で、東大生とほぼ同じ水準で執筆できるとわかった。

(※)ニュース記事、メール文、職務経歴書を10回ずつ作成した際の平均所要時間

一方で、正確性を示す事実と異なる記載をした率は東大生が20%、ELYZA Pencilが27%。キーワード含有率は東大生が100%、ELYZA Pencilが94%。「正確性」と「キーワード含有率」では人間よりELYZA Pencilのほうが劣る。

ELYZAはELYZA Pencilを発表した背景についてこう説明している。

「2018年秋にブレイクスルーが起き、Googleより大規模言語AI『BERT』が発表され、2019年にはNLP分野で『人間を超える』精度を達成されました。そのため、英語ではNLPの最先端技術を実用化したサービスや事例が誕生しています。

一方、日本語では言語特性に依存する技術的な難易度の高さや公開されているデータ量の問題から、NLPの最先端技術の実用化が遅れていました。

ELYZAは、この状況に問題意識を持ち、2020年にBERT以降の大規模言語AIと弊社独自の大規模データセットを活用した日本語特化AIエンジン『ELYZA Brain』を開発しました。

その後、ELYZA Brainの改良を行ないつつ、日常・ビジネスの場でよく発生する『文章生成』という問題設定に特化し、この度、皆さまに文章執筆 AI”ELYZA Pencil”をお披露目するに至りました」

(※ニュースリリースより)

今後、ELYZAは 「書く」「まとめる」「読む」「答える」などの業務を大規模言語AIでサポートすることで、全国民のビジネス業務10%以上をAIへ代替できる可能性があるのではないかと想定しているという。

なお、ELYZA Pencilの利用規約では暴力的・残虐、わいせつ、差別的な表現そのほか不適切な表現を入力すること、出力データにかかる表現が含まれる場合はSNSなどを通じて公表することを禁止している。

>>ニュースリリース