Ledge.ai編集部では今まで、企業が提供するAI(人工知能)APIを実際に試し、結果や精度を記事にして紹介してきました。
試したAPIやライブラリはなんと22以上。画像認識、音声認識、自然言語処理なども網羅的に取り上げており、AI業界で名を連ねる企業のAPIなどにも触れてきました。
そこで今回は、Ledge.aiでこれまで公開されてきた「AI(人工知能)を使ってみた記事」を企業別にまとめて紹介します。
目次
- IBM
- 東芝
- リクルート
- Microsoft
- Salesforce
- スワローインキュベート
- jeeliz
- ユーザーローカル
IBM ─ Watson(画像認識)
プログラミング不要!Watson「Visual Recognition」でオリジナル画像認識AIを作る
Visual Recognitionとは、Watson APIsのひとつで、ディープラーニングを使用して、画像に写った物体・情景・顔などさまざまなものを分析・認識する画像認識APIです。
無料の「IBM Cloudライト・アカウント」で、さっそくWatson APIを試してみた
Natural Language Understanding
Natural Language Understanding とは、文章を分析して、その文章の概念やエンティティー、キーワード、感情、意味役割などのメタデータを抽出してくれる言語解析APIです。
Tone Analyzer API Tone Analyzerとは、文章を分析してトーンという独自の指標を検出する言語解析APIです。
「喜怒哀楽」「文体」「社交性」の3要素を分析することで、礼儀正しさ同情的ななどのトーンを検出してくれます。
コールセンターでの会話やチャットなどで利用すれば、カスタマー対応コミュニケーション改善などに役立てられます
Personality Insights APIPersonality Insights
Personality Insights APIPersonality Insights とは、文章を分析してトランザクション・データやSNSデータを分析して、心理的な特性を識別してくれる特性識別APIです。
東芝 ─ RECAIUS(音声合成)
東芝のコミュニケーションAI「RECAIUS」で人間の声を再現する
音声合成サービス東芝の音声合成サービスは、多様な話者と感情表現でテキストを音声化します。さらに、豊富なカスタマイズによって、意図に沿った人間味のある音声合成が可能です。
リクルート ─ A3RT
リクルートがAIをまさかの無料公開。さっそくすべてのAPIを試しまくってみた
Text Suggest APIText Suggest API
Text Suggest APIText Suggest APIとは、Recurrent Neural NetworkやLSTMと呼ばれる構造の言語モデルを利用した、文章の自動生成および入力補助を実現するAPI。膨大な原稿を学習することで、その中の文章の言い回しや表現を機械が学習し、ユーザが入力した単語や文章の後に続く文章を生成します。
Text Classification APIText Classification APIは、Convolutional Neural Networkを利用して、文章の分類を行うAPIです。
例えば、学習データとしてニュース記事とそのトピック(スポーツや政治など)を与えると、未知の記事データに対してのトピックを推定してくれます。
Talk API
Talk APIは、Chatbotを作成するためのAPIです。 Recurrent Neural Network(LSTM)を用いた入力文からの応答文生成による日常会話応答機能を提供します。 Talk APIを活用したChatbotによって様々なアプリケーション上でユーザとの対話を自動化し、 どのようなタイミングにおいても即座にユーザからの問いかけに対して応答可能。
Image Infuluence API
Image Infuluence APIは、画像と画像に対応する点数を用意すると、未知の画像が自分好みかどうかを点数で把握できるモデルが作成可能。写真が不特定多数から見て良さそうに見えるかどうか、点数という形で返却します。
Listing API
Listing APIは、ユーザーの行動ログを元にアイテム間の相関リストや、各ユーザーへのレコメンドリストなどを生成することが出来ます。オンラインレコメンドや、ターゲティングメールなどに使用でき、モデルリングのためのデータを手元に用意していただければ、元データアップロード・リスト生成ロジック実行・リストダウンロードの機能が利用出来ます。
画像からテキスト検索?画像生成もできるリクルートのAI「A3RT」のAPIを使ってみた
Image Search API
Image Search APIは、画像とテキストの相互検索APIです。マルチモーダルDeep Learningという技術により画像とテキストの関係を学習することでテキストから画像を検索したり、画像からテキストを検索したりといったことが可能となります。
Image Generate API
Image Generate APIは、Deep Convolutional Generative Adversarial Networks(DCGAN)の技術を用いてオリジナルの画像を生成するAPIです。このモデルでは、既に自動生成された画像を合成し、新しい画像を作ることができます。
AIが文章の意味を理解する?リクルートのAI「A3RT」に新しく追加されたText Summarization APIで文章を要約してみた
Text Summarization API
Text Summarization APIは、文章要約を行うAPIです。入力された文章それぞれの意味を読み取り、特徴的な文章を抽出することができます。
Microsoft ─ Cognitive Services(音声認識)
音声認識AIで議事録を自動化できるか?MicrosoftのAPIを使って検証してみた
Speech to Text APISpeech to Text APIはオーディオをテキストへ変換してくれます。マイクからのリアルタイムな音声認識、ファイル形式の音声認識などが可能。日本語にも対応しています。
Speaker Recognition APISpeaker Recognition APIは音声から話者を識別してくれます。まずは音声を学習させ、それをもとにAIが話者を判別可能に。対応言語は英語、中国語です。
AIに感情は読み取れるか?MicrosoftのFace APIで感情分析をしてみた
Face APIFace APIは、画像内の人間の顔 (複数可) を検出して、検出した顔の画像内での位置を示す顔矩形と、機械学習に基づく顔の特徴の予測値を含む顔属性を返します。2つの顔が同一人物のものである可能性の度合いを示す信頼度スコアを返却する機能もあります。
手作業30分がAIでたったの6分に。写真管理をMicrosoftの画像認識AIで自動化したらすごかった
Computer Vision API
Computer Vision APIは、単に画像に対して、単語や確率などを出してくれるだけではなく、“画像から文章を生成してくれる”機能があります。
Salesforce ─ Einstein(画像認識)
Salesforceの画像認識AI『Einstein Vision』試してみた
Einstein Vision
Einstein Visionは、セールスフォース・ドットコム社が提供する画像認識に関するAPI群となります。CRMに画像認識を活用したり、AI(人工知能)を組み込んだアプリの開発を迅速に行うことを可能にします。
スワローインキュベート(音声解析)
AIがヒトの感情を理解する?パナソニック特許の感情認識技術で、音声解析してみた
感情認識AIスワローインキュベートが提供する感情認識AIは、音響解析により音声自体が持つ特徴量から、怒り・喜び・平静の感情を判定してくれます。
jeeliz(コンテンツ生成)
ブラウザだけでバーチャルYouTuberやAnimojiを再現。WebGLと深層学習を駆使したJavaScriptライブラリ「jeeliz」がすごい
jeelizは、WebGLとディープラーニング、3Dコンテンツを作成するためのJavaScriptライブラリThree.jsによって、ブラウザだけでAnimoji(アニ文字)や顔検出に基づいたAR(拡張現実)アプリケーションを開発可能なAPI
ユーザーローカル(画像加工)
個人情報流出を防ぐ「自動車画像加工AIライブラリ」の実力 ── 技術の標準搭載で我々の生活は一変する
自動車画像加工AIライブラリ自動車画像加工AIライブラリは、複数車体からメインの車体のみ検出、ナンバープレートを検出して自動でぼかす、車体以外の背景を自動でぼかす、といった機能もっています。