MessengerでURLを送るだけ。自然言語処理で記事が要約できるSummarizeBotを試してみた

このエントリーをはてなブックマークに追加

通勤時間や休憩時間にスマートフォンでニュースに目を通す人も多くなった現代。

できるだけ多くの情報を把握したい……ですが、すべて読まないまでも記事の内容をざっくり知りたいときってありますよね。記事の内容を簡単に要約できたらなんて思いますが、なかなかそういったツールはありません。

今回紹介するSummarizeBotはなんとMessengerでBotに記事のURLを送るだけで要約してくれます。実際に使ってみました。

自然言語処理を中心に多様なツールを提供するSummarizeBot

SummarizeBot機械学習ブロックチェーン自然言語処理の技術をもとにデータ分析を行う会社であり、AIを用いたさまざまなAPIを提供しています。

APIの種類は多岐にわたり、なんとその数12種類。豊富なサービスを提供しています。

  • Summarization 要約
  • Keywords Extraction キーワード検出
  • Article Extraction 記事の内容・タイトルなどの抽出
  • News Aggregation 多くのリソースの中から記事を収集
  • Fake News Detection フェイクニュース検出
  • Comments Extraction コメント抽出
  • Stemming 語幹処理
  • News Sentiment Analysis ニュースがポジティブかネガティブかを分析
  • Language Detection 言語検出
  • Video Identification 動画の形式の検出
  • Face Detection 顔の検出
  • Image Recognition 画像認識

自然言語処理を中心とし、フェイクニュース検知など特徴的なAPIも用意されています。

現在、AIを用いたAPIはさまざまな企業が提供していますが、中でもSummarizeBotが特徴的な部分は以下の通り。

  • ブロックチェーン、機械学習の技術を組み合わせたテキスト・動画・写真の分析
  • webリンクからの抽出が可能
  • pdf、mp3、doc、txt、jpgなどさまざまなファイル形式が使用可能
  • 100以上もの言語に対応

機械学習とブロックチェーンの組み合わせによる精度の高い分析に期待です。

また、webリンクからの抽出が可能な点や、多様なファイル形式が使える点は使い勝手の良さにつながっています。

Messengerで気軽に要約。要約サイズの調整も可能なSummarization API

冒頭でご紹介した記事の要約が可能なSummarizeBot

BotにURLを送る仕組みになっており、おなじみのMessengerやSlack上で使用できます。

使い方は簡単。BotにURLを送信後、数秒すると記事が要約されます。また要約だけでなく、キーワード、キーセンテンスがそれぞれ表示できます。

サマリーサイズが指定でき、結果の保存やシェアもできるという優れもの。

実際に、URLを送ってみると……

記事の中から重要文を見つけ出し、それらをまとめて要約。サマリーサイズに応じて重要度が高い文の順に表示しているようです。

次に、キーワード・キーセンテンスを表示してみます。

記事の中でどれだけそのワードが出てきたかなどを中心にキーワードを抽出し、それをもとにキーセンテンスを抽出しています。

日本語にも対応していますが、要約の際に広告の文を抽出してしまったりと、英語に比べるとそこまで精度が良くないようでした。

機械学習×ブロックチェーンでデータを取得し保全

SummarizeBot では主に3つの技術をもとに自然言語処理を中心をしたAPIを提供しています。

  • 機械学習※
    テキストの抽出・言語検出・文、単語の区切りの認知・語幹処理をおこなう。

  • AIによる分類※
    余分な情報を削減し、要約の関連性を上げる。

  • ブロックチェーン
    モデルの訓練を行う際に、より多くの訓練データが取得でき、データの安全性を高める。

    ※元サイトにてMachine Learning、Artificial Intelligenceと分けて表記されているため、そちらに準拠しています。

  • 機械学習では訓練データの量と質がとても重要になってきますが、データの管理をブロックチェーンでおこなうことで量・質ともに向上します。

    機械学習とブロックチェーンの組み合わせは珍しいですが、これからこのような組み合わせが今後増えてくるかもしれませんね。

    自然言語処理の多方面での可能性

    要約やキーワード検出といった自然言語処理。さまざまな場所で活用が可能です。

    研究の分野では、長い文章、論文の要約により、時間の節約に。

    マーケティングの分野では、膨大な情報の抽出によるコピー、広告の作成。

    図書館、博物館といった施設では膨大な書類の要約による整理など。

    幅広い分野で仕事の効率化につながると思います。

    SummarizeBotは今後、

    • 会話の要約
    • 動画の要約
    • 複数の文書をまとめて要約
    • 医療データの要約

    といったサービスを提供するそう。さまざまな場面での実用が可能なSummarizeBotにこれからも注目していきましょう。

    別記事では、実際に「Fake News Detection API、New Sentiment API」を使ってその精度を検証してみます。そちらもぜひお楽しみに。