エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
オフラインでストリーミング音声認識できるVoskを使ってみた - 佐藤百貨店
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
オフラインでストリーミング音声認識できるVoskを使ってみた - 佐藤百貨店
Whisperを除けば、無料でここまでできる音声認識は他に無いのでは、と思えるほど素晴らしい特長を備えた... Whisperを除けば、無料でここまでできる音声認識は他に無いのでは、と思えるほど素晴らしい特長を備えた音声認識Vosk。日本語ビッグモデルでサクッと試せる記事が見当たらなかったので、まとめてみました。 Voskの特長 オフライン対応 日本語を含む20以上の言語を認識 ストリーミング認識対応 CPUでも比較的早く認識できる Pythonを中心にいろんな言語をサポート 無料 オープンソース 日本語モデルの種類 こちらに対応モデル一覧があり、日本語だと48MByteの軽量モデル、1GByteのビッグモデルの2種類が提供されています。 動作確認環境 ミニPC: TRIGKEY Green G5 OS: Ubuntu 22.04.3 Dockerがインストール済み 全体の流れ 日本語ビッグモデルをなるべく手軽に動かしたかったので、次の方法で試しました。 ①音声認識サーバーを立ち上げる。 ②クライア

