circleken.net[B!]新着記事・評価 - はてなブックマーク

『circleken.net』

日本語音声認識API主要5社比較
3 users
circleken.net

1. 日本語音声認識の比較実験実際にそれぞれのAPIを使用して同一の音声データをテキスト化。正解のテキストと比較して認識精度を評価する。 1.1. 音声認識の評価指標CER（Character Error Rate）によって評価を行う。 CERとは、例えば正解テキストが「こんにちは」だったとして「こんばんは」と認識された場合、 5文字中2文字が間違っているため「CER=2/5=40%」のようにエラー率を計算する評価指標。 pythonではjiwerというライブラリを使用することで簡単に計算できる。エラー率なので値が小さいほど精度が良いことになる。本記事における実験結果ではCERの逆数、つまり正解率を記載しているため値が大きいほど精度が良い。 1.2. 認識する音声データ声優事務所の音声サンプルを使用した。アイムエンタープライズの公式WEBサイトは音声サンプルの長さがほどよく、ファイ
- テクノロジー
- 2022/05/19 12:41
- 音声認識

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx