Microsoft Computer Vision API ── Microsoftの画像認識AI「Computer Vision API」でファイル名付けを自動化
Microsoftの画像認識AI「Computer Vision API」を使い、適切なファイル名を自動で付けています。画像ファイル名は初期値が「IMG_13.JPG」とかなので、探す時に結構大変ですよね。画像内容に合わせたファイル名付けの自動化を実際に試してみました。
Speech to Text API ── 音声認識AIで議事録を自動テキスト化!MicrosoftのAPIで実践してみた
現在、いくつかの音声認識AIがありますがMicrosoftのAIは音声をテキスト化するのはもちろん、誰が喋っているかも判別してくれます。話者判定とテキスト化どちらもどれくらいの精度なのか、議事録の自動テキスト化でチャレンジしてみました。
Microsoft Face API ── MicrosoftのFace APIで画像認識を利用した感情分析を試してみる
MicrosoftのFace APIを使うことで画像中の顔を認識し年齢や性別、感情などを推定、2つの写真の人物を同一人物かどうか判別可能になります。今記事では、人の感情読み取りにフォーカスし、顔認識AIがどのように利活用可能か、実際にAPIを試しながら紹介します。
Image Generate API & Image Search API ── 【無料API】リクルートのAI「A3RT」で画像からテキスト検索してみた
AIだからこそ可能になる体験というのが昨今可能になっています。そんな可能性を感じるAPIをリクルートが提供しています。画像生成モデルリクルートが「A3RT」を無料公開したということで、レコメンドや画像解析、文章校閲を可能にするAPIを使ってみました。
スワローインキュベート 感情認識AI ── AIが感情を理解?パナソニック特許技術搭載の感情認識AIで音声解析してみた
ヒトはあらゆる場面で音声というツールを利用しますが、その音声についてまわるのが、“感情” です。音声に表れる感情を解析することで、できることは様々。今回の記事では、感情認識AIがどのように音声を解析してくれるのか、実際にAPIを利用して紹介していきます。
RECAIUS ── 東芝のコミュニケーションAI「RECAIUS」で人間の声を再現する
RECAIUSは、1978年より開発が進められ、2000件以上の特許をもつ技術に基づいており、音声合成、音声認識、意図理解、画像認識などのサービスがあります。その中の一つ、多様な感情表現が可能であるRECAIUSのwebAPI『音声合成サービス』を実際に使ってみました。
Text Summarization API ── AIが文章の意味を理解する?リクルートのAI「A3RT」で文章要約してみた
リクルートテクノロジーズが提供する「A3RT」のText Summarization APIを使って実際に文章を要約。記事コンテンツや新聞等のテキストからAIが文章の意味を読み取り、重要なセンテンスを抽出してくれます。APIは無料で利用できるので試してみてください。
Watson Visual Recognition ── Watson Visual Recognitionでオリジナル画像認識AIを作る
Watson APIでは画像認識AIを簡単に試せるのはもちろん、自前データをAIに学習させ、独自のカスタムモデルを使った画像認識がすぐに試せます。誰でも簡単に試せるとのことなので、早速Watson Visual Recognitionでオリジナルの画像認識AIを作ってみました。本記事ではその行程をご紹介します。
jeeliz ── WebGL × 深層学習ライブラリ「jeeliz」でバーチャルYouTuberやAnimojiを再現
「jeeliz」はブラウザだけで顔検出、11種類の表情認識を実現するJavaScriptライブラリです。深度センサー等を使わずにディープラーニングとWebGLで実現しています。GitHubでコードも公開されているので、デモ等も試せます。
SQL Suggest API ── 自然言語からSQL文を生成!リクルートのAI A3RT「SQL Suggest API」でクエリを作る
SQL Suggest APIは、ニューラルネットワークを使った文の生成モデル「Seq2Seq(sequence to sequence)」を応用した技術。“日本語の質問文をSQLに変換する” リクルートAI A3RTの『SQL Suggest API』を試してみます。
Face++ ── 中国公安当局が採用するAI「Face++」を試してわかった、UIとしての画像認識
画像認識技術において中国で頭ひとつ抜き出ているのがMegviiが展開するプラットフォーム「Face++」。Face++が提供するジェスチャー認識「Gesture Recognition」と目線の認識「Gaze Estimation」の精度を実際に試してみました。
CycleGAN ── 機械学習アルゴリズム「CycleGAN」で若葉を紅葉に変えてみた
機械学習アルゴリズム「CycleGAN」は、GANでスタイル変換を行う手法のひとつ。このCycleGANで若葉から偽物の紅葉を作り出してみました。 人の目を欺く自然な画像を生成するAIの仕組み・実際の作成手順をご紹介します。
Image Colorization ── AIが表現する“インスタ映え”。着色・生成・〇〇風変換するAPIを使い倒す
Photoshopなど使うことで目的に合わせた画像編集・加工作業をAIが支援してくれます。画像編集・加工が可能なAPIを、人物写真や風景写真、画像のいち部分が欠けている画像などで試してみます。
Everybody Dance Now ── AIが一般人を一瞬でダンサーに。OpenPoseを応用した「Everybody Dance Now」がすごい
OpenPoseとGANを組み合わせた「Everybody Dance Now」。踊りたいダンス映像を学習させることで、一瞬で踊れるようにしてくれます。
2019年、落合 陽一氏、中島 聡氏がゲスト登壇する「THE AI 3rd」開催
さまざまなAIライブラリ&APIを紹介してきましたが、2019年、技術はさらに洗練され、社会実装されていくことでしょう。
さっそく2019年も株式会社レッジ主催の大規模AIカンファレンス「THE AI 3rd|AI時代の適者生存 生まれ変わるために”今”すべきこと」の開催を控えています。
ゲストとして、落合 陽一氏、中島 聡氏も登壇します。名だたる企業の登壇も決まっていますので、興味がある方はぜひ特設サイトよりご確認ください。過去のカンファレンス「THE AI 2nd」の様子の紹介、イベントレポートも挙がっています。