【Google I/O 2019】音声アシスタントをすべての人が使う未来像が見えた──プロが振り返る

このエントリーをはてなブックマークに追加

Googleの開発者向けカンファレンス「Google I/O」。

昨年はGoogle Duplexなど、「目立つ」プロダクトが発表されたが、今年はよりプライバシーとセキュリティが全面に押し出された内容となった。

関連記事:キーワードはオンデバイス。「Google I/O 2019」で発表されたAI関連注目トピックまとめ

そんなGoogleと昨年、音声認識の研究を行うVoice Labをシンガポールに設立したのが、世界的なパフォーマンスエージェンシーであるiProspectだ。日本法人は電通の子会社の形を取り、音声を活用したプランニングやボイスSEO(音声アシスタント経由で行われる検索のSEO)にも力を入れる。

今年のGoogle I/Oを、音声認識の可能性も絡め、iProspectで音声のスペシャリストを務める2人に振り返ってもらった。

クライアントの音声認識に対する関心が2年連続2位に

iProspectは電通イージスのグループ会社だ。世界有数のデジタルパフォーマンスエージェンシーでもあり、SEOに力を入れてきた。そのため、検索エンジンを持つGoogleとは深いつながりがある。

近年では音声認識に注力している。その理由は、「iProspectが実施しているクライアントへのアンケート結果だ」。iProspectの音声認識グローバルディレクターであるネイト・シュリラ氏はそう語る。

ネイト・シュリラ氏 iProspect 音声認識技術グローバルディレクター

――シュリラ
「我々が実施しているクライアントへの年次アンケートで、音声認識に対する関心がアンケートで2年連続2位を獲得したんです。企業の音声認識への高い興味が伺えました」

iProspectはボイスSEOにも明るい。音声アシスタントに「近くのおすすめのレストランを教えて」と話しかければ、すぐに周辺のおいしいお店を教えてくれるだろう。そのときに推薦する店舗、もしくは商材の露出を最適化するのがボイスSEOだ。シュリラ氏によれば、ボイスSEOについての問い合わせも近年増えているという。

2018年にはGoogleと組み、シンガポールに音声認識の研究を行う「Voice Lab」を設立した。研究成果を企業のマーケティングプランニングなどに活かすという。

興味深いのは、音声により稼働するボットの開発だ。このボットは、音声入力により、企業のさまざまなデータをビジュアライズすることが可能だ。このボットで企業のプランニングをサポートしていくという。今はまだ外販していないが、今後のリリースが待たれるツールだ。

Google I/Oは「プライバシー」が裏テーマだった

そんなiProspectは、ボイスの分野で発表が多かった今年のGoogle I/Oをどう振り返るのか。

筆者もリアルタイムで基調講演を聴いていたが、全編を通して印象深かったのは「オンデバイス」と「プライバシー&セキュリティ」というキーワードだ。

AIをオンデバイス、つまりエッジ側で処理することにより、端末のデータをクラウドに送る必要がない。これによりプライバシーを担保する姿勢を強く感じた。

――シュリラ
「まさにそうで、特に音声アシスタントが進化していくことで、プライバシーがより重要な要素になってきます。いろいろな発表がありましたが、裏テーマはプライバシーの保護でした」

シュリラ氏いわく、Googleアシスタントが一番効果を発揮するのは、自分のパーソナルデータを端末へ提供することだ。パーソナルデータによって、より精度の高いレコメンデーションが可能になる。

しかし、自分のパーソナルなデータがクラウドに送られることは、プライバシーが部分的にでも侵害される恐れも高まる。データをエッジ側で処理すれば、データは外に出ない。セキュリティが担保されれば、ユーザーもパーソナルデータを共有しやすくなる。

そこでGoogleは「エッジ側で処理を完結できる」ことをアピールすることで、安全性をアピールできると考えた。近年問題視されてきた、巨大テック企業による情報漏えいへの対抗策として。

――シュリラ
「Googleからするとエッジでの処理は、ユーザーのことを考えた結果として避けては通れない、必然なものでした。エッジで処理できればデータ漏えいの危険性は薄まり、かつ処理速度も爆速です。アンドロイドにおけるユーザビリティの面でも利益になります」

音声アシスタントの可能性

もう少しスコープを広げて、今後、音声アシスタントはどうなっていくのか。

iProspect Japan COOの渡辺大吾氏は、音声アシスタントについて「今後はユーザーが自発的に使おうとしなくてもさまざまなデバイスに搭載され、より身近な存在になる」と語る。

渡辺大吾氏 iProspect Japan COO

――渡辺
「音声は年齢、属性、業界関係なく、ほとんどの人がアクセス可能なコミュニケーションツールです。今後はスマートフォン、スマートスピーカーだけでなく、家電などにも急速に搭載されていくでしょう。

私の母親も、フリック入力が煩わしくスマホは使えませんが、Googleアシスタントやアレクサなどは話すだけでよいので、音声アシスタントのほうが使いやすいようです」

また、2020年の東京五輪に向けて、訪日外国人の増加も予想される。渡辺はそのタイミングでボイスアシスタントの活用が進むと語る。

――渡辺
「情報を言語関係なく、誰にでもアクセス可能なものにすることが重要になってきます。

たとえば、ベジタリアンやビーガンの方が外食をする際の問題。友人がビーガンでしたが、日本で食べられるフードを探すのに大変苦労しました。東京五輪の際も、レストランや店舗などで原材料を確認するために音声による同時通訳などの対応が必要になってくるでしょう。

また、スマートフォンやスマートディスプレイといったスクリーンと連動させ音声+視覚を組み合わせることで、より容易に問題を解決することが可能になるはずです」

加えて、音声アシスタントは災害対策にも活用の可能性があるという。

たとえば自分のいる建物が倒壊したとする。デバイスは目の前にあるのに、あと一歩届かない。そんなときに声のみでデバイスを通じて助けを求めることがもしできれば、被災者が助かる可能性も飛躍的に高まる。

――渡辺
「加えて、声はコミュニケーションの中で一番物理的に伝達が速い方法です。緊急時には最も有効な手段となるはずです。災害の際にも、事前に予測してアラート発報はもちろん、避難経路や避難場所などに声でアクセスできるのが理想ですよね」