kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた | 株式会社AI Shift

テクノロジーカテゴリーの変更を依頼記事元:

www.ai-shift.co.jp

11 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

misshiki “この記事では、オープンソースの日本語End-to-End音声認識モデルの性能を評価しました。”

2024/06/13 リンク

sh19910711 "いずれもReazonSpeechコーパスを用いて訓練 / どのモデルも音声認識性能が高く、CERやWERだけではその性能を十分に評価することが難しくなってる / 使用シナリオに適した書き起こしをしてくれるモデルを選択することが重要"

2024/06/12 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた | 株式会社AI Shift

はじめにこんにちは、AIチームの大竹です。最近、高性能な日本語音声認識モデルのリリースが相次いで... はじめにこんにちは、AIチームの大竹です。最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をして性能を比較してみました。書き起こしや評価周りの実装も記載しているので参考にしていただけたら幸いです。モデルの直近のリリースをまとめると、以下のようになっています。ReazonSpeechコーパスのリリースを皮切りに日本語に特化した音声認識モデルの開発の勢いが加速しているように思えます。ReazonSpeechコーパスは、地上波テレビ放送から収集された音声に基づいて構築されています。v1では19,000時間、v2では35,000時間の音声が含まれていて、日本語音声認識モデルの学習リソースとしては世界一の規模となっています。公開時期モデル名公

あとで読む

ブックマークしたユーザー

pokutuna2024/06/17
yug12242024/06/14
misshiki2024/06/13
triceratoppo2024/06/12
lyiase2024/06/12
sh199107112024/06/12
ranto3811242024/06/12
kabukawa2024/06/12

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx