東大松尾研発ELYZA 長文をたった3行に要約できるAIを試してみた!精度が高くてすごい

このエントリーをはてなブックマークに追加

東京大学松尾研発のAI(人工知能)スタートアップである株式会社ELYZA(イライザ)は8月26日、日本語における生成型要約モデルの開発に成功したと発表。同モデルを用いた要約AI「ELYZA DIGEST(イライザ ダイジェスト)」をデモサイトとして一般公開した。

本AIは、入力したテキストデータを3行に要約できるもの。国内での成功例が少ないという「生成型要約」を採用しており、読み込んだテキストをもとにAIが一から要約文を生成する。

今回はLedge.ai編集部が8月に掲載したニュース記事を本AIで要約してみた。

囲碁の対局中に抜き打ち身体検査 スマホ所持は反則負け、AIを用いた不正防止

まずは、囲碁の日本棋院がAIを用いた不正を防止するため、対局中に抜き打ちの身体検査および手荷物検査することを決定したというニュースから。348文字の記事を94文字に要約してくれた。

日本棋院はAIを用いた不正を防止するため、対局中に手荷物検査を決定した。スマホなどの電子機器を所持していることが明らかになった場合、反則負けと判断。対局停止などの重い処分を検討するという。

NEC、AIが人流データで来客数と販売数を予測 パン屋の廃棄数を最大約9割削減

次は、日本電気株式会社(NEC)がAIを活用することで、スマート街路灯に搭載したネットワークカメラから得られる人流データなどを学習・分析し、来客数と販売数を予測する実証実験を実施したというニュース。765文字の記事を113文字に要約してくれた。

NECは17日、AIを活用した実証実験を実施したと発表した。スマート街路灯に搭載したカメラから得られる人流データなどを学習・分析。売れ残りによる廃棄数を従来実績から最大9割程度削減できるケースも。

rinna、日本語に特化した「GPT-2」「BERT」事前学習モデルを無償公開 75ギガバイトのデータを最大45日間で学習

次は、元女子高生AI「りんな」などで知られるrinna株式会社が、日本語に特化した「GPT-2」と「BERT」の事前学習モデルを開発したというニュース。1674文字の記事を116文字に要約してくれた。

ただし、「予測したい単語より前の単語を考慮して、次の単語を予測する」のはGPT-2、「学習データと学習時間を増やし、より高性能なモデルにアップデートした」のはrinnaが過去に発表したGPT2-mediumである。

RINNA株式会社は25日、日本語に特化した「GPT-2」と「BERT」の事前学習モデルを開発したと発表。予測したい単語より前の単語を考慮して、次の単語を予測する。学習データと学習時間を増やし、より高性能なモデルにアップデートした。

「AIが転けたらソフトバンクグループが転ける」孫正義さん、大幅な減益でも自信揺らがず

次は、ソフトバンクグループ株式会社 代表取締役 会長兼社長執行役員の孫正義さんが2022年3月期 第1四半期 決算説明会のなかで、AI革命について「(今後も)『間違いなく広がる』と心から確信を持って言える」と語ったというニュース。1399文字の記事を99文字に要約してくれた。

ソフトバンクの孫正義社長が10日、AI革命について言及した。AI革命は「間違いなく広がる」と心から確信を持って言えると語った。AI革命は始まったばかりだと信じて、不退転で取り組んでいきたいと述べた。

イーロン・マスク氏「長期的にはベーシックインカムが必要」人間型ロボット開発に意欲

最後は、米テスラの共同創業者兼CEO(最高経営責任者)であるイーロン・マスク氏が人間型ロボット「Tesla Bot」を開発すると表明したというニュース。848文字の記事を109文字に要約してくれた。

米テスラの共同創業者兼CEOイーロン・マスク氏が19日、人間型ロボットを開発すると表明。ロボットは身長が約173CM、5フィート8インチ、体重は約57KG。ロボットは2022年中にはプロトタイプを開発する見込みという。

人間は5分程度かかる文章を10秒以下で要約するAI、長文をたった3行に

ELYZAが発表したプレスリリースでは「全体の90%の記事に対して問題ない出力ができており、人間に匹敵する精度で要約文を生成できている」と記されている。その言葉のとおり、本AIはとても高い精度だと確認できた。

本AIについて詳細が気になる人は、以下の記事をあわせてチェックしてほしい。