複数人の会話から特定の1人だけを音声識別する手法　米NVIDIA「CONF-TSASR」開発

テクノロジーカテゴリーの変更を依頼記事元:

www.itmedia.co.jp

8 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

Seamless 話者情報を与えると複数が同時に話す会話の中でも特定の人物の声だけを抽出して書き起こす技術。

2023/08/25 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

複数人の会話から特定の1人だけを音声識別する手法　米NVIDIA「CONF-TSASR」開発

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless... このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 話者プロファイルと補助発話（ターゲット話者）が与えられた重複多話者環境において、「単一チャネル話者自動音声認識」という特定の話者の発話を書き起こすタスクがある。この研究では、エンド・ツー・エンドの単一チャネル話者自動音声認識「CONF-TSASR」を提案する。このモデルは、TitaNetベースの話者埋め込みモジュール、Conformer（Transf ormerとCNNを組み合わせたモデル）ベースのMaskNet、ASRモジュールから構成される。TitaNetは目標話者の補助発話から話者埋め込みを抽出する。MaskNetはConformer

ブックマークしたユーザー

mntone2023/08/25
feilong2023/08/25
Seamless2023/08/25

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx