リアルタイム音声認識をwhisperのturboモデル+faster_whisperで動かす

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/ryuke

2users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

リアルタイム音声認識をwhisperのturboモデル+faster_whisperで動かす

こちらが公式リポジトリに掲載されている比較表です。モデルサイズがlargeの半分程度に抑えられ、速度... こちらが公式リポジトリに掲載されている比較表です。モデルサイズがlargeの半分程度に抑えられ、速度に至ってはlargeの最大8倍と大幅に改善されています。精度についてもlarge-v3には多少劣るものの、日本語ではlarge-v2と同レベルの性能が出ています。 faster_whisper faster_whisperもwhisperの高速化実装です。Transf ormerモデルの高速化に特化したエンジンであるCTranslate2を使って推論速度を大幅に（4倍程度）向上させています。 turboがモデル構造の変更・軽量化による高速化なのに対して、こちらは推論の計算処理をモデルレイヤーの融合、ビット量子化、バッチの入れ替えなどによって最適化しています。 whisper_mic whisper_mic はwhisperをマイクに繋いで簡単に動かせるようにした薄いライブラリです。Whis

ブックマークしたユーザー

kamm2025/12/04
takayaman2025/09/09

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx