「単語レベルのテキストマイニングを壊す。」文章解析AIで隠れた本音を可視化

このエントリーをはてなブックマークに追加

レッジは最新の事例から今のAIを知る大規模AIカンファレンス『THE AI 2nd』を7月26日に開催。名だたる豪華企業が今のAIのリアルを赤裸々に語り、あらためてAI領域の熱の高まりを感じるイベントとなりました。

『THE AI』
株式会社レッジが「未来ではなく、今のAIを話そう。」というテーマで主催する、大型のAIビジネスカンファレンス。具体的すぎたり抽象的すぎる話ではなく、ビジネスにおいてどの程度のコストで、どこまで活用可能か? という視点で、AIのスペシャリストたちが語ります。
THE AI 2ndの詳細はこちら

本記事では、Insight Tech CEO 伊藤友博氏の講演をお届けします。

「身近なところに本音や隠れたナレッジが溢れている」と話す伊藤さん。本音を可視化し優先課題を特定する文章解析AIの性能と事例についてお話していただきました。

伊藤 友博
株式会社 Insight Tech/CEO
1974年愛知県生まれ。1999年早稲田大学院建設工学修了、同年、大手シンクタンクに入社。ビッグデータマーケティング、AI(人工知能)を活用した新事業開発を牽引。2017年より現職。日本マーケティング学会学会委員。

本音、隠れたナレッジの宝庫である自然文に眠る価値

──伊藤
「アンケートや口コミで得られた情報には本音が、日報で得られた情報にはナレッジがあったりと、自然文のテキスト情報には価値ある情報が豊富に存在しています。

しかし、自然文のデータはそのまま使える状態ではなく、人間が適時読まなければならなかったり、要約の必要があったりします。そのため、テキスト情報が得られても、十分に活用できていないのが現状です。」

たしかに選択式のアンケートや評価では、自由記述の場合に比べると適当に回答してしまうこともありますよね。

自然文の方が本音が出やすいと思いますが、一方で、自然文そのままでは、

  • 人がアンケートを読む必要があり、手間と時間がかかる
  • パッとみて理解しづらい
  • 口調や書き方などを踏まえ主観でみてしまい、人によって判断が異なる

といった問題点があるそう。

──伊藤
「今まで自然文のテキスト情報は、ビジネスにおいて積極的に取り扱われることは少なかったですが、構文解析によって本音の見える化を図ることで、自然文の活用を狙っています。」

自然文を可視化・分類することで活用できる“価値ある情報”にしていきたいとのこと。

ただし、単語だけでなく文脈を読み取る必要があったりと、自然文の解析にはさまざまな試行錯誤があったようです。

──伊藤
「自然言語処理にあたり膨大なテキストデータが必要になってきますが、すぐに集められるテキストデータとしては技術文書や商品へのレビューなどが多く、なかなか自然な日本語の文章は集めにくいのが実情です。

そこで、不満に対してお金を払う『不満買取センター』によって、大量の自然文を集め、これを学習用データとして活用しています。」

すごい……!データが足りないなら集めるのはありがちですが、人々が抱く不満に目をつけ、それを買い取ろうという発想は斬新です。

大量の自然文テキストデータは、Insight Techの大きな武器になり、実際に不満買取センターで集めた不満インサイトデータを、マーケティングや商品開発での利用を目的とした会社に提供しているそう。

加えて、この独自の自然文テキストデータを活用してオンリーワンの文章解析AIを構築したそうです。

自然文を構文解析することで本音を可視化。課題の優先順位付けまでおこなうITAS

──伊藤
「Insight Techの技術の強みは、アカデミアの知をいち早く汲み取ることができること。大学から民間の研究所まで多岐にわたり連携をおこなうことで、常に最新の研究知見をビジネスに応用できています。」

Insight Techは、最先端の言語処理技術を誇る京都大学の黒橋・河原研究室といった強力な産学連携のもと、独自のAIエンジンの構築とこれを活用した課題解決に取り組んでいます。


注:Insight Techが共同研究やデータ提供などで連携実績がある大学・研究機関。

このようにして結集させた最先端技術とオンリーワンの学習用データを組み合わせることで創造されたのが、3つのAIから成る文章解析サービスITAS(Insight Tech Text Analytics Service)です。

  • 意見タグAI
    原文を構文解析。意見性のあるフレーズを抽出。

  • 可視化AI
    類似する意見フレーズを束ね、全体を可視化。

  • 感情分類AI
    原文から読み取れる発言者の感情を「ポジティブ」、「ニュートラル」、「ネガティブ」に分類。ネガティブについては更に「低不満」、「嫌気」、「怒り」、「あきらめ失望」に細分化。

たとえば車に対するフィードバックを、意見タグAIを用いて抽出した場合は以下のようになります。

乗り心地はフラットで、とても快適である。ただし、ウィンカーの位置が分かりづらく、右折する際、ウィンカーが遅れ、危険を感じることがある。ウィンカーの位置を見直してほしい。

意見対象部意見述部
乗り心地フラット
乗り心地快適である
ウィンカーの位置分かりづらく
ウィンカー遅れ
ウィンカーの位置見直してほしい

──伊藤
「原文から “何に対するどんな意見”かを説明する意見タグの抽出をおこなっています。単語ではなくフレーズで内容を構造化しているからこそ、可能になります。」

意見対象部意見述部、それぞれが対応するように認知することで、パッと見ただけで理解できるようになっています。

こうしてAIによって抽出した意見タグを、意味合いが類似するようにクラスタリングするのが可視化AI

可視化AIを用いることで、上のように意見タグの分類がひと目で分かるようになっています。

ここでは「フレーズ」で意見内容の全体を俯瞰し、把握しているそう。

「エンジン音 → 静かすぎて」の項目をみても、少し表現が違うにも関わらず1項目にまとめられています。

可視化マップによって、どのような意見がどの程度のボリュームあるのかが理解しやすくなりますが、さまざまな意見があるため、どの不満から解決していくかの優先順位付けができません。

そこで用いるのが感情分類AIです。

──伊藤
「感情分類AIの特徴は、文章を節で分割し、節単位で感情分類できることです。ネガティブカテゴリーに振り分けられた単語に関しては、『低不満』・『嫌気』・『怒り』・『あきらめ失望』に細分化することができます。

そうすることで1件1件の感情の重み付け、優先順位付けが可能になりひと目でどこから手をつけるべきか理解できます。」

意見と言っても、「どちらかというと悪かった」や「本当に嫌だった」などと、それぞれ度合いは違います。

実際に苦情や不満をもとに改善をおこなっていく場合に、不満の度合によって取り組むべき改善の優先順位を決めることができそうです。

自然文から本音を抽出し、そして課題解決へと導く流れは、目を見張るものがあります。

顧客、従業員の声を可視化。人の本音で課題解決へと導くITAS

では、実際に可視化された本音・隠れたナレッジはどのような部分で活用されているのでしょうか?

具体的には、Cbaseと提携した離職リスクを可視化する「スマレビ for リテンション」、LIONとのプロジェクトで、口臭不満をITASで解析することから生まれた「口臭ケアサポートアプリ」の開発といった事例。

分析だけでなく、意思決定やサービス開発に直接的に活用されているのが分かります。

また、アンケート調査に記述されたフリーアンサーをもとにNPS(顧客ロイヤルティを数値化した指標)を向上させるフレーズを発見したり、webコンテンツのテキストからコンバージョンしやすいフレーズを発見し、優先順位をもとにした打ち手を導出するなど、目的に応じた使われ方をしています。

──伊藤
「技術はもちろん、使いやすさを実感してほしいです。というのも、技術ではなく課題解決に目を向けているからです。

課題解決ファーストで、ピンポイントで技術を組み合わせて適用させる。ITASを使うことで日本語のテキストデータが活用できることを実感してほしいですね。

そして、ITASで『単語レベル』のテキストマイニングの限界をブレークスルーしていくことで、日本ビジネスの競争力強化に貢献したいです。それが結果として、日本のAIビジネスを強くし、育てることにつながると確信しています。」

自然文を読むことはそれなりに工数がかかるため、ユーザーの本音をビジネスで扱うことはなかなか難しいことでした。

そうなると、ユーザーの建前のみを扱うことになり、真のユーザーニーズに合わせた提案や対応ができないのは大きな問題でした。しかし、文脈まで汲みとる構文解析の技術によって、自然文から本音が可視化され、課題解決に大きく貢献することができます。

本音の出やすいツイッターなどのSNSやコールセンターに届く顧客の声・クレームなど、本音が潜んでいそうなところは数多くあります。その本音をAIで解析することで、サービス改善であったり、新たなビジネスの創出につながるかもしれません。

今後、本音はマーケティングからサービス改善・新サービスの創出まであらゆる領域で成長・改善の起点になりそうです。自然文の構文解析による本音の抽出が、どのようにマーケティングや価値創造の形を変えていくか、注目していきたいですね。

株式会社 Insight Techの講演資料は下記からダウンロード可能

本講演の資料は、下記からダウンロード可能です。