【保存版】8企業のAIを“使ってみた記事”13個まとめ! 画像認識・音声認識・自然言語処理まで網羅

このエントリーをはてなブックマークに追加

Ledge.ai編集部では今まで、企業が提供する人工知能APIを実際に試し、結果や精度を記事にして紹介してきました。

これまで試したAPIやライブラリはなんと22以上。AI業界で名を連ねる企業のAPIなどももちろん試しています。

そこで今回は、これまでご紹介した“AIを使ってみた記事”を以下の企業別にお届けしたいと思います。

目次

  • IBM
  • 東芝
  • リクルート
  • Microsoft
  • Salesforce
  • スワローインキュベート
  • jeeliz
  • ユーザーローカル

IBM ─ Watson

プログラミング不要!Watson「Visual Recognition」でオリジナル画像認識AIを作る

Visual Recognition API

Visual Recognitionとは、Watson APIsのひとつで、ディープラーニングを使用して、画像に写った物体・情景・顔などさまざまなものを分析・認識する画像認識APIです。
画像認識AIを簡単に試せるだけでなく、自前データをAIに学習させることで、独自のカスタムモデルを使った画像認識をすぐに試すことができます。

無料の「IBM Cloudライト・アカウント」で、さっそくWatson APIを試してみた

Natural Language Understanding

Natural Language Understanding とは、文章を分析して、その文章の概念やエンティティー、キーワード、感情、意味役割などのメタデータを抽出してくれる言語解析APIです。

Tone Analyzer API

Tone Analyzer とは、文章を分析してトーンという独自の指標を検出する言語解析APIです。
「喜怒哀楽」「文体」「社交性」の3要素を分析することで、礼儀正しさ同情的ななどのトーンを検出してくれます。
コールセンターでの会話やチャットなどで利用すれば、カスタマー対応コミュニケーション改善などに役立てられます

Personality Insights API

Personality Insights とは、文章を分析してトランザクション・データやSNSデータを分析して、心理的な特性を識別してくれる特性識別APIです。

東芝 ─ RECAIUS

東芝のコミュニケーションAI「RECAIUS」で人間の声を再現する

音声合成サービス

東芝の音声合成サービスは、多様な話者と感情表現でテキストを音声化します。さらに、豊富なカスタマイズによって、意図に沿った人間味のある音声合成が可能です。

リクルート ─ A3RT

リクルートがAIをまさかの無料公開。さっそくすべてのAPIを試しまくってみた

Text Suggest API

Text Suggest APIは、Recurrent Neural NetworkやLSTMと呼ばれる構造の言語モデルを利用した、文章の自動生成および入力補助を実現するAPI。膨大な原稿を学習することで、その中の文章の言い回しや表現を機械が学習し、ユーザが入力した単語や文章の後に続く文章を生成します。

Text Classification API

Text Classification APIは、Convolutional Neural Networkを利用して、文章の分類を行うAPIです。
例えば、学習データとしてニュース記事とそのトピック(スポーツや政治など)を与えると、未知の記事データに対してのトピックを推定してくれます。

Talk API

Talk APIは、Chatbotを作成するためのAPIです。 Recurrent Neural Network(LSTM)を用いた入力文からの応答文生成による日常会話応答機能を提供します。 Talk APIを活用したChatbotによって様々なアプリケーション上でユーザとの対話を自動化し、 どのようなタイミングにおいても即座にユーザからの問いかけに対して応答可能。

Image Infuluence API

画像と画像に対応する点数を用意すると、未知の画像が自分好みかどうかを点数で把握できるモデルが作成可能。写真が不特定多数から見て良さそうに見えるかどうか、点数という形で返却します。

Listing API

Listing APIは、ユーザーの行動ログを元にアイテム間の相関リストや、各ユーザーへのレコメンドリストなどを生成することが出来ます。オンラインレコメンドや、ターゲティングメールなどに使用でき、モデルリングのためのデータを手元に用意していただければ、元データアップロード・リスト生成ロジック実行・リストダウンロードの機能が利用出来ます。

画像からテキスト検索?画像生成もできるリクルートのAI「A3RT」のAPIを使ってみた

Image Search API

Image Search APIは、画像とテキストの相互検索APIです。マルチモーダルDeep Learningという技術により画像とテキストの関係を学習することでテキストから画像を検索したり、画像からテキストを検索したりといったことが可能となります。

Image Generate API

Image Generate APIは、Deep Convolutional Generative Adversarial Networks(DCGAN)の技術を用いてオリジナルの画像を生成するAPIです。このモデルでは、既に自動生成された画像を合成し、新しい画像を作ることができます。

AIが文章の意味を理解する?リクルートのAI「A3RT」に新しく追加されたText Summarization APIで文章を要約してみた

Text Summarization API

Text Summarization APIは、文章要約を行うAPIです。入力された文章それぞれの意味を読み取り、特徴的な文章を抽出することができます。

Microsoft ─ Cognitive Services

音声認識AIで議事録を自動化できるか?MicrosoftのAPIを使って検証してみた

Speech to Text API

Speech to Text APIはオーディオをテキストへ変換してくれます。マイクからのリアルタイムな音声認識、ファイル形式の音声認識などが可能。日本語にも対応しています。

Speaker Recognition API

Speaker Recognition APIは音声から話者を識別してくれます。まずは音声を学習させ、それをもとにAIが話者を判別可能に。対応言語は英語、中国語です。

AIに感情は読み取れるか?MicrosoftのFace APIで感情分析をしてみた

Face API

Face APIは、画像内の人間の顔 (複数可) を検出して、検出した顔の画像内での位置を示す顔矩形と、機械学習に基づく顔の特徴の予測値を含む顔属性を返します。2つの顔が同一人物のものである可能性の度合いを示す信頼度スコアを返却する機能もあります。

手作業30分がAIでたったの6分に。写真管理をMicrosoftの画像認識AIで自動化したらすごかった

Computer Vision API

Computer Vision APIは、単に画像に対して、単語や確率などを出してくれるだけではなく、“画像から文章を生成してくれる”機能があります。

Salesforce ─ Einstein

Salesforceの画像認識AI『Einstein Vision』試してみた

Einstein Vision

Einstein Visionは、セールスフォース・ドットコム社が提供する画像認識に関するAPI群となります。CRMに画像認識を活用したり、AI(人工知能)を組み込んだアプリの開発を迅速に行うことを可能にします。

スワローインキュベート

AIがヒトの感情を理解する?パナソニック特許の感情認識技術で、音声解析してみた

感情認識AI

スワローインキュベートが提供する感情認識AIは、音響解析により音声自体が持つ特徴量から、怒り・喜び・平静の感情を判定してくれます。

jeeliz

ブラウザだけでバーチャルYouTuberやAnimojiを再現。WebGLと深層学習を駆使したJavaScriptライブラリ「jeeliz」がすごい

jeeliz
jeelizは、WebGLとディープラーニング、3Dコンテンツを作成するためのJavaScriptライブラリThree.jsによって、ブラウザだけでAnimoji(アニ文字)や顔検出に基づいたAR(拡張現実)アプリケーションを開発可能なAPI

ユーザーローカル

個人情報流出を防ぐ「自動車画像加工AIライブラリ」の実力 ── 技術の標準搭載で我々の生活は一変する

自動車画像加工AIライブラリ

自動車画像加工AIライブラリは、複数車体からメインの車体のみ検出、ナンバープレートを検出して自動でぼかす、車体以外の背景を自動でぼかす、といった機能もっています。