はじめに AWSの自動音声認識サービスAmazon Transcribeが日本語に対応したとのことで、日本語音声を入力して文字起こしを試してみました。 題材 以下のニュース動画を利用しました。 YahooとLINE 統合を発表 - テレ東NEWS 1人のアナウンサーが1分間ほどニュースを読み上げる内容となっていて、複数人による会話などはありません。 文字起こし方法 Transcribeは、 マネジメントコンソール AWS CLI AWS SDK for Python (Boto) にて利用できますが、今回はAWS CLIを使ってみます。 1. 変換をリクエストする あらかじめ以下のJSONを用意しておいた上で、aws transcribe start-transcription-jobを実行します。 { "TranscriptionJobName": "yl", "LanguageCode