Google Cloud PlatformにはSpeech APIという音声認識を行うための機能があります。今回はこちらのAPIを使って、Pythonで音声の日本語をテキストに起こしてみようと思います。Speech APIの詳細。 また、Pythonで録音するプログラムと合わせて使うことで、録音した音声をほぼリアルタイムにテキスト化するプログラムも作成いたしましたので、ぜひ参考にしてください。 音声ファイルをテキストにするサンプルプログラム 以下にサンプルプログラムを示します。 #coding:utf8 import base64 from googleapiclient import discovery import httplib2 #APIキーを設定 key = "YourAPIKey" #音声認識に使うファイル名 speech_file = "sample.wav" #URL情報