エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
INTERSPEECH2024から見る音声認識研究の動向 - Ridge-institute R&D Blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
INTERSPEECH2024から見る音声認識研究の動向 - Ridge-institute R&D Blog
はじめに INTERSPEECH 2024から見る音声認識研究の動向 複数話者の音声認識 複数言語の音声認識 デコー... はじめに INTERSPEECH 2024から見る音声認識研究の動向 複数話者の音声認識 複数言語の音声認識 デコーディング処理 文脈バイアス 表現学習 その他トピック まとめ 参考文献 はじめに 前回の記事では音声認識の基本と代表的な大規模学習済みモデルを紹介させていただきました。 音声認識や音声合成はさまざまなアプリケーションで目にする機会が増えました。一方で、現在の技術でもまだまだ課題はあります。 本稿は近年の研究モチベーションを代表的なタスクである音声認識をベースに紹介させていただきたいと思います。 INTERSPEECH 2024から見る音声認識研究の動向 本稿は、音声認識を扱う国際会議のINTERSPEECHを中心に、近年の研究の動向をまとめたいと思います。 複数話者の音声認識 音声認識の応用が広がる中で、研究領域でもより実応用を想定したタスクへの拡張が行われています。 その一

