エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
世界最大の日本語音声コーパスと音声認識モデルをリリースしました - 2023-01-18 - ククログ
まず注目すべきは音声コーパスで、日本語音声のデータセットとしては世界最大です。 一般公開されている... まず注目すべきは音声コーパスで、日本語音声のデータセットとしては世界最大です。 一般公開されているものでは JSUT が10時間、 Common Voice が80時間程なので、 既存コーパス比で200〜1900倍のデータサイズになり、これが無償で誰でも使えるようになります。 二番目の音声認識モデルは、コーパスをもとに ESPnet のモデルを学習したものです。 精度を検証してみると、昨年、OpenAIがリリースした Whisper の最も大きいモデルと同等の性能がでているので、世界最先端の水準と言って良い精度だと思います。このモデルのライセンスはApacheライセンス2.0なので商用利用もオッケーです。 音声認識モデルの精度がどのくらいかは 公式サイトのデモ で試せます。 三番目のツールキットはコーパスを作成するために開発したPythonライブラリで、 これを使えば日本語コーパスを誰でも
2023/01/18 リンク