IBM Watson の Speech to Text は、ディープ・ラーニングを活用して音声を認識しテキストに変換してくれるサービスです。IBM Cloud のライト・アカウントで一定の範囲内であれば無料で使えます。そこで今回は、Watson の Speech to Text を使って日本語音声をテキストに変換する手順をまとめてみました。 (2018年12月31日更新)APIの認証方式が変わったため記事を更新しました。以前と比べてAPIの認証手順が簡単になっています。 5秒で試せる Speech to Text Speech to Text のデモサイトで、Voice Model を日本語(Japanese)にしてブラウザに向かって話す、もしくは音声ファイル(.mp3, .mpeg, .wav, .flac, .opus)をアップロードするだけで試せます。利用登録も必要ありません。 IB