画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ
![無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ](https://cdn-ak-scissors.b.st-hatena.com/image/square/93214659ff512ac0aff9f9e6969a27738484ad02/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2022%2F09%2F29%2Fopenai-whisper-install-and-usage%2F00.png)