Googleの無料サービスTeachable Machine ノーコードで音声認識モデルを作成してみた

このエントリーをはてなブックマークに追加

Teachable MachineはGoogleが提供する、簡単に機械学習のモデルを作成できるサービスです。今回は「音声プロジェクト」を作成します。

まずはTeachable Machineにアクセスし、「使ってみる」をクリックします。

「音声プロジェクト」を選択します。

今回は「おはよう」「こんにちは」「こんばんは」を分類するモデルを作成します。「バックグラウンドノイズ」の「マイク」をクリックします。

ここではノイズを記録するので、「20秒間録画する」をクリックし、何も話さずに20秒間待ちます。その後、「サンプルを抽出」をクリックします。

次に「おはよう」という音声を記録します。「Class2」で「2秒間録画する」をクリックし、マイクに向かって「おはよう」と言います。

その後、「サンプルを抽出」のクリックを4回繰り返します。ここで、わかりやすいように「Class2」を「おはよう」に変更します。

同様に、「こんにちは」と「こんばんは」も作成し、「モデルをトレーニングする」をクリックします。

学習が完了したら、出力部分を確認します。何も話さない場合は「バックグラウンドノイズ」の可能性が1番高くなります。

それぞれの言葉をマイクに話すと、対応するラベルの可能性が高くなることが確認できました。

最後に

今回はTeachable Machineを使い、音声認識のモデルが作成できました。本サービスを使うと、プログラミングのコードを書くことなく、簡単なドラック操作のみで、機械学習のモデルを作成できます。また、Teachable Machineでは、今後も新しいモデルも追加されるので、ぜひ試してみてください。