okishima_kのブックマーク - はてなブックマーク

okishima_k id:okishima_k

ブックマーク / ai-data-base.com (1)

大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大 | AIDB
これまでの大規模言語モデルは基本的にテキストデータのみを扱うことが前提でした。Metaとケンブリッジ大学の研究者チームは、この限界を打破する新たな手法を提案しました。参照論文情報タイトル：Prompting Large Language Models with Speech Recognition Abilities 著者：Yassir Fathullah, Chunyang Wu et al. 所属：Meta AI、ケンブリッジ大学 URL：https://doi.org/10.48550/arXiv.2307.11795 関連研究 MRIデータから音声を合成する手法　UCバークレーなどが開発 AudioGPT：音声認識から歌声合成まで人の音声からAIが「性格」を予測音声データを直接理解するAI 研究の目的と手法この研究の主要な目的は、大規模言語モデルが音声データを直接理解し、
okishima_k 2023/08/04
AI

研究
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx