Amazon Transcribeは、自動音声認識と呼ばれるディープラーニング(深層学習)プロセスを使って素早く高精度に音声をテキストに変換できます。
今回は、Amazon Transcribeを使って実際に音声データの文字起こしをしてみました。
基本的にはチュートリアルにそって進めていきます。
チュートリアルから使用する音声をダウンロードし、こちらからAWSマネジメントコンソールを開きます。
検索バーに「s3」と入力し、一番上のものを選択します。
「バケットを作成」をクリックします。
ここではタグ、デフォルトの暗号化などさまざまな設定ができますが、今回は名前以外の設定は初期値のまま「バケットを作成」をクリックします。
作成したバケットが確認できるので、名前の部分をクリックします。
「アップロード」をクリックします。
さきほどダウンロードしたファイルをアップロードし、「アップロード」をクリックします。
次にAmazon Transcribeにアクセスし、「Amazon Transcribeの使用を開始する」をクリックします。
左上のナビバーの中から「Transcription jobs」を選択します。
「Create job」をクリックします。
「Name」の欄には「sample-transcription-job」と入力します。
「Input data」の欄にはさきほどアップロードしたファイルを選択します。
「Next」をクリックします。
「Audio settings」「Content removal」「Customization」の設定ができますが、今回は初期設定のままにし、「Create job」をクリックします。
「Status」が「Complete」になったら、「Name」の欄の「 sample-transcription-job 」をクリックします。
下の方にスクロールすると、文字起こしの結果が確認できました。
最後に
今回はAmazon Transcribeを使って、サンプルの音声ファイルの文字起こしをしてみました。Amazon Transcribeを使うと、音声をテキストに変換する機能をアプリケーションに簡単に追加することもできるので、ぜひ試してみてください。