サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
TGS2024
tango-web.github.io
Text-to-Audio Generation using Instruction Tuned LLM and Latent Diffusion Model Deepanway Ghosal1, Navonil Majumder1, Ambuj Mehrish1, Soujanya Poria1 1DeCLaRe Lab, Singapore University of Technology and Design, Singapore 🔥🔥🎉🎉 We released Tango 2 which surpasses the performance of AudioLDM2 and Tango. Access it here. 🔥🔥🎉🎉 We released Tango-AF trained on synthetic AudioSet captions. Access i
このページを最初にブックマークしてみませんか?
『Text-to-Audio Generation using Instruction Tuned LLM and Latent Diffusion Model』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く