Whisperを試す Whisperの音声認識が優秀ということで、マイクで試せるようにしてみました。 別に無理して使う必要なかったのですが、諸事上によりDockerを使ってマイクがつながったアプリとソケット通信したりしています。以下みたいな感じです。 リポジトリは以下です。 ほとんど自分のためのメモですが、同じようなことしたい人がいるかもしれないので、簡単に説明を書いておきます。 説明はちょい雑です(すみません)。今後追記したり補足するかも…です。 セットアップ方法 Linux(Ubuntu)前提です。Windows(WSL2)でも多分動くと思います。 マイク マイクは適当なUSBマイクをつなげてください。以下でデバイスを確認できます。 **** ハードウェアデバイス CAPTURE のリスト **** カード 0: Device [USB PnP Audio Device], デバイス
![マイク入力をWhisperで音声認識](https://cdn-ak-scissors.b.st-hatena.com/image/square/b68f459aed6f07b2a757cbfb820b0d1155111f18/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--bCcZE86D--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525E3%252583%25259E%2525E3%252582%2525A4%2525E3%252582%2525AF%2525E5%252585%2525A5%2525E5%25258A%25259B%2525E3%252582%252592Whisper%2525E3%252581%2525A7%2525E9%25259F%2525B3%2525E5%2525A3%2525B0%2525E8%2525AA%25258D%2525E8%2525AD%252598%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3Akaraage0703%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9saDMuZ29vZ2xldXNlcmNvbnRlbnQuY29tL2EtL0FPaDE0R2hDZEtvakJfZXdDTjNCV1Z0WXIteFNIZ0hmRjlXZmt3QzI5c0Y0aXYwPXMyNTAtYw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)