タグ

ブックマーク / tech.revcomm.co.jp (1)

  • Whisperの音声認識精度および認識速度の検証 - RevComm Tech Blog

    TL;DR🤩 音声認識Whisperの認識精度と認識速度について調査 認識精度 英語では論文同様の結果 日語の認識精度はドメインに依存 baseモデルの推論がドメインにより不安定 ビームサーチの利用により、推論の頑健性が向上 largeモデルのCERはbaseモデルの半分程度 認識速度 baseモデルのRTFはGPUで0.104 largeのRTFは0.408 バッチサイズなどを最適化することで改善 こんにちは。RevCommのリサーチチームでインターンをしている中田亘です。 2022年9月21日にOpenAIからWhisperと呼ばれる音声認識器が一般に公開されました。今回は、Whisperの性能に関して調査を行ったので紹介します。 TL;DR🤩 Whisperとは 実験と結果 実験条件 認識精度 英語でのWER LibriSpeech test-clean test-other

    Whisperの音声認識精度および認識速度の検証 - RevComm Tech Blog
    khtno73
    khtno73 2022/11/10
    アクセントや抑揚による感情分析ではなく、単純な音声認識器。性能出てるのでAmivoiceのSDKやCloud APIとかを文字起こし機能のためだけに契約して自社サービス/システムに組み込んでるところは切り替え検討になるかな?
  • 1