世界最大の日本語音声コーパスと音声認識モデルをリリースしました - 2023-01-18 - ククログ

テクノロジーカテゴリーの変更を依頼記事元:

www.clear-code.com

1user がブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

tasukuchan “レアゾン・ホールディングスさん”

2023/01/18 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

世界最大の日本語音声コーパスと音声認識モデルをリリースしました - 2023-01-18 - ククログ

まず注目すべきは音声コーパスで、日本語音声のデータセットとしては世界最大です。一般公開されている... まず注目すべきは音声コーパスで、日本語音声のデータセットとしては世界最大です。一般公開されているものでは JSUT が10時間、 Common Voice が80時間程なので、既存コーパス比で200〜1900倍のデータサイズになり、これが無償で誰でも使えるようになります。二番目の音声認識モデルは、コーパスをもとに ESPnet のモデルを学習したものです。精度を検証してみると、昨年、OpenAIがリリースした Whisper の最も大きいモデルと同等の性能がでているので、世界最先端の水準と言って良い精度だと思います。このモデルのライセンスはApacheライセンス2.0なので商用利用もオッケーです。音声認識モデルの精度がどのくらいかは公式サイトのデモで試せます。三番目のツールキットはコーパスを作成するために開発したPythonライブラリで、これを使えば日本語コーパスを誰でも

ブックマークしたユーザー

tasukuchan2023/01/18

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx