アマゾンのAWSでテキストを解析してみた

このエントリーをはてなブックマークに追加

Amazon Comprehendは、機械学習を使用してテキスト内のインサイトや関係性を検出できる自然言語処理(NLP)サービスです。キーフレーズ抽出、感情分析、実体認識、トピック形成、言語検出 API の利用ができ、アプリケーションへの統合もできます。今回は、実際に英語と日本語の文章の解析をしてみます。

こちらからAWSマネジメントコンソールを開きます。

検索バーに「Amazon Comprehend」と入力し、一番上のものを選択します。

「Launch Amazon Comprehend」をクリックします。

「Real-time analysis」になっていることを確認し、下にスクロールします。

初期状態では、英語のサンプルテキストが入力されています。

「Insight」では、テキスト分析の結果を確認できます。分析結果は6項目に分かれており、「Entities」では「人名」「組織名」「日付」など文章中の単語が属するタイプとその信頼性を確認できます。

「Key phrases」では、文章中の重要な単語を抽出します。

「Language」では、テキストの主要言語を判定します。

「Pll」では、個人を特定できるような情報を抽出します。

「Sentiment」では、「Positive」「Negative」「Mixed」「Neutral」の4種類からテキストの感情を判定できます。

「Syntax」ではテキストの構文解析の結果が確認できます。

次に、日本語のテキストを入力してみます。テキストはチュートリアルから1つ選びます。

新しいテキストを入力したら、「Analyze」をクリックします。

「Sentiment」を確認すると、ポジティブと判定されました。なお、2021年11月現在、「PII」と「Syntax」は日本語に対応していません。

最後に

今回はAmazon Comprehendを使って、英語と日本語のテキストの解析を試してみました。チャットボットへの適用など応用の範囲は幅広いので、ぜひ試してみてください。