Last Updated on 2025-04-23 10:38 by admin Nari Labsは2025年4月19日、16億パラメータを持つテキスト読み上げ(TTS)モデル「Dia」をリリースした。このモデルはテキストから直接自然な対話を生成することができる。 Diaの共同制作者であるToby Kimは、このモデルがGoogleのNotebookLMのポッドキャスト機能に匹敵し、ElevenLabs StudioやSesameのオープンモデルの品質を上回ると主張している。また、OpenAIの最近リリースしたgpt-4o-mini-ttsに対する競合製品となる可能性がある。 Diaは資金ゼロで開発され、GoogleのTensor Processing Unit(TPU)を使用してトレーニングされた。現在、DiaのコードとモデルウェイトはHugging FaceとGitHubで公開され