リクルートがAIをまさかの無料公開。さっそくすべてのAPIを試しまくってみた

このエントリーをはてなブックマークに追加

自動生成、入力補助を実現するText Suggest API

Text Suggest API文章の自動生成、入力補助をしてくれるAPI。ある単語を入力すると、「その次に来そうな文章」を生成してくれます。

といってもよくわからんと思うので、まず手始めに「」という単語で試してみましょう。

{
  "status": 0,
  "message": "ok",
  "suggestion": [
    "の窓で手を出しています。",
    "が二台止まっています。",
    "が停車しています。"
  ]
}

こんな感じです。しっかりと単語の意味を認識して対応する文章を自動で生成してくれています。

もう少し長い文章「明日の天気は」でも試してみます。

{
  "status": 0,
  "message": "ok",
  "suggestion": [
    "、が見えます。",
    "、オレンジ色で、白い飛行機です。",
    "、、、白い壁があるトイレから写真が、見えます。"
  ]
}

んー……何かしらの文章は生成してくれますが、日本語としてはまったく成り立っていませんね。。残念な感じ。。

今のところは、基本的に単語でないと精度はでないようです。

同じ要領で、プログラミングのソースコードを一部かくことで後ろを生成したりもしてくれるのですが、試してみると正直よくわからない感じ。

ここらへんも含め、今後に期待というところでしょうか。

ただ、進化したら文章の自動生成や、プログラムコードの自動生成なんてことにも使えるかもしれませんよね。未来感ハンパないです。

文章の自動分類を行うText Classification API

Text Classification API学習データによって自動的に文章を分類してくれるAPI。

今回はA3RTで用意されている学習データを使います。

この学習データでは、単語を入力すると、関連するある職種に分類してくれるようになっています。さすがリクルートといった感じ。求人票とかで使えそうですね。

まずは単語で「Java」と、プログラミング言語で職種を分類してくれるか試します!

{
  "status": 0,
  "message": "ok",
  "classes": [
    {
      "label": "ITエンジニア(システム開発・SE・インフラ)",
      "probability": 1
    },
    {
      "label": "Web・インターネット・ゲーム",
      "probability": 5.0718e-8
    },
    {
      "label": "エンジニア(機械・電気・電子・半導体・制御)",
      "probability": 1.27158e-13
    },
    {
      "label": "専門職(コンサルタント・士業・金融・不動産)",
      "probability": 5.98484e-17
    },
    {
      "label": "クリエイティブ(メディア・アパレル・デザイン)",
      "probability": 4.8718e-19
    },
    //以下省略

なるほど、こんな感じですね。ITエンジニアの職種がトップに出てきました!

ではもう少し長い文章で「英語を教える」はどうでしょうか?

{
  "status": 0,
  "message": "ok",
  "classes": [
    {
      "probability": 0.617317,
      "label": "教育・保育・公務員・農林水産・その他"
    },
    {
      "probability": 0.357657,
      "label": "事務・管理"
    },
    {
      "probability": 0.0177112,
      "label": "企画・マーケティング・経営・管理職"
    },
    {
      "probability": 0.00569101,
      "label": "営業"
    },
    {
      "probability": 0.000914245,
      "label": "専門職(コンサルタント・士業・金融・不動産)"
    },
    //以下省略

教育がトップにでてきました。Text Classification APIの精度はそれなりに高そうな印象をうけます。

たとえば、チャットbotの中でこのAPIを組み込んだりしたら、ユーザーの入力文を分類してシナリオ分岐させる、なんてことも可能になるのかもしれませんね。

それができれば、より正確なFAQや、雑談botの応答精度を上げることが可能になりそう。

文章の怪しい箇所を検知するProofreading API

Proofreading API 入力されたテキストの文法的に疑わしい部分を指摘してくれるAPI。

どんなメディアでも、誤字脱字はどんなに注意を払っても起こってしまうのが正直なところ。Ledgeももちろんですが。。

ということで早速試してみます。まずは「システムの規格から 開発・運用まで幅広く関われます。」をインプット。誤字の「規格」はちゃんと指摘されるんでしょうか。しっかり指摘してほしい!

{
  "status": 1,
  "message": "pointed out",
  "alerts": [
    {
      "checkedSentence": "システム の <<規格>> から 開発 ・ 運用 まで 幅広く 関われ ます 。",
      "alertCode": 0,
      "alertDetail": "a little unnatural",
      "word": "規格",
      "rankingScore": 0.02951777886020458
    }
  ]
}

お、しっかりと指摘してくれてます! さらにアラートオプションでは誤字なのか、文脈的に不自然な表現なのか、というのも指摘してくれるので良い判断材料にはなりそうです。

いずれは指摘だけでなく、正しい表現もサジェストしてくれると助かりますね。

ちなみに「システムの気格から開発・運用まで幅広く関われます。」と他の誤字で試してみると

{
  "status": 0,
  "message": "ok"
}

okとでてしまいました。。おい、なんでや。

まだまだ完全に頼れる、とまではいかなそうですが、それなりに工数の削減には寄与してくれそうです。これで校正の時間が少し削減される……かも。



1 2 3