エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Whisper-V3-Large-Turbo-MLXを試す|shi3z
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Whisper-V3-Large-Turbo-MLXを試す|shi3z
Whisper-V3-Large-Turboが速いというので試してみた。 なんか雑にモデルだけ置いてあったのでMacでリア... Whisper-V3-Large-Turboが速いというので試してみた。 なんか雑にモデルだけ置いてあったのでMacでリアルタイムに音声認識するようにした。 ただし、リアルタイムと言っても、本当の意味でのリアルタイムではない。 音声を収録→認識するので認識してる間の音声は取りこぼしてしまう。 これを解決するにはマルチスレッディングにしたりしないといけないんだけど、僕が欲しいのはそこまでのものではなかったのでとりあえずこれでいいことにする。 import pyaudio import numpy as np import mlx_whisper # 音声キャプチャの設定 FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 16000 CHUNK = 1024*2 # 5秒間の音声をキャプチャ # PyAudioの初期化 audio = pyaudio.P