アマゾンのAWSで音声の文字起こしサービスを無料で試してみた

このエントリーをはてなブックマークに追加

Amazon Transcribeは、自動音声認識と呼ばれるディープラーニング(深層学習)プロセスを使って素早く高精度に音声をテキストに変換できます。

今回は、Amazon Transcribeを使って実際に音声データの文字起こしをしてみました。

基本的にはチュートリアルにそって進めていきます。


チュートリアルから使用する音声をダウンロードし、こちらからAWSマネジメントコンソールを開きます。


検索バーに「s3」と入力し、一番上のものを選択します。


「バケットを作成」をクリックします。


ここではタグ、デフォルトの暗号化などさまざまな設定ができますが、今回は名前以外の設定は初期値のまま「バケットを作成」をクリックします。


作成したバケットが確認できるので、名前の部分をクリックします。


「アップロード」をクリックします。


さきほどダウンロードしたファイルをアップロードし、「アップロード」をクリックします。


次にAmazon Transcribeにアクセスし、「Amazon Transcribeの使用を開始する」をクリックします。



左上のナビバーの中から「Transcription jobs」を選択します。


「Create job」をクリックします。


「Name」の欄には「sample-transcription-job」と入力します。


「Input data」の欄にはさきほどアップロードしたファイルを選択します。


「Next」をクリックします。


「Audio settings」「Content removal」「Customization」の設定ができますが、今回は初期設定のままにし、「Create job」をクリックします。


「Status」が「Complete」になったら、「Name」の欄の「 sample-transcription-job 」をクリックします。


下の方にスクロールすると、文字起こしの結果が確認できました。

最後に

今回はAmazon Transcribeを使って、サンプルの音声ファイルの文字起こしをしてみました。Amazon Transcribeを使うと、音声をテキストに変換する機能をアプリケーションに簡単に追加することもできるので、ぜひ試してみてください。