はじめに ういっすういっすういっすー!✌️ ぱー🖐 nikkieです。 シオン・プロジェクト、Whisper章の続編です。 観測範囲ではいろんな方がWhisperを触られてますね〜。 Whisperを使えば短いコードで音声ファイルを書き起こせます! 今回は「音声ファイルではなく、マイクから入力した音声は書き起こせるの?」という疑問にアプローチします。 目次 はじめに 目次 前回のシオン・プロジェクト!:環境構築 動作環境 結論:Whisperはマイクからも音声認識できます! 「何度でも認識させよう」のモチベーション マイクから入力した音声の認識、既存のアプローチ マイクから入力した音声の認識、提案したいアプローチ 音声データの渡し方を調査:transcribeメソッドは何をしているのか whisper.load_model whisper.model.Whisper.transcribe