朝日新聞社、長文を要約できるAPIを無償公開 約500字の文章を約200字に

このエントリーをはてなブックマークに追加

株式会社朝日新聞社は4月2日、長い文章を入力し、要約した文章に変換できる「長文要約生成API」を公開したと発表。本APIは約500字の文章を約200字に変換したり、文章を30%や50%削減したり、用途に応じた文章を生成する。評価用途に限り、無償で利用可能だ。

「長文要約生成API」は、過去30年分の朝日新聞記事のデータおよび、記事を生み出すフローで生み出した内部データを活用している。学習データとしての処理効率を上げるためのフィルタリングなどをした上で、ディープラーニング(深層学習)技術を施した。

公式サイトより

本APIでは「入力された文章を、指定した長さごとに区切ってTSUNAで要約する」「文ごとの長さがそろうように圧縮する」「文ごとに指定した割合まで圧縮する」「重要な文を抽出する」「抽出した重要文を圧縮し、文書全体を指定した長さにする」の5つの機能を提供する。

これらの機能を単独で使用したり、連結して組み合わせたりすることで、長文の内容を把握しやすく要約できるという。「Web上の文章やビジネス文章、議事録、エントリーシートの内容などを素早く内容を判別したい/速読したい」といった用途に活用できるとしている。

朝日新聞社はすでに、自動で見出しや要約を生成する「自動要約生成API TSUNA」をリリースしている。今回公開した「長文要約生成API」は、TSUNAで培ってきた技術をもとに研究を進め、文章を圧縮する技術を開発した。TSUNAと組み合わせることで、大量の文章に自動で見出しと要約を付与し、一覧にすることも可能だ。

>>ニュースリリース

自然言語処理の仕組みや活用例は?

自然言語は人間が使う言葉の総称で、自然言語処理(NLP)は人工知能(AI)を支える研究分野の一つである。「長文要約生成API」は自然言語処理研究の成果の1つである「長文要約生成」の機能を体験できるAPIと言える。

Ledge.ai編集部では、自然言語処理の仕組みや活用例、今後の課題について詳しく解説している。気になる人は以下の記事をチェックしてほしい。