2024年5月28日のブックマーク (1件)

  • JSAI2024参加記録 - 英語帝国を打倒しよう

    僕の発表は金曜の9:40~ Aホールであります。よろしくお願いします~ 28日、火曜日 [1G3-GS-6-04] 連続表現を用いたSpeech-to-Text対話モデルの構築 HUBERT特徴量を入力として、テキストを出力するモデルを学習。そのモデルの事前学習にLLMを用いる。モデルは音声認識タスクで事前学習→対話タスクで学習という順序で利用 rinnaも同じようなことをしているらしい。音声認識で学習したモデルが事前学習済みモデルとして利用されることもあるのかな? https://rinna.co.jp/news/2023/12/20231207.html [1B4-GS-2-03] 宝くじ仮説の観点からの Grokking の理解 Grokking:暗記→汎化が起きたという現象 なぜこんなことが起こるの?→モデルの構造が変化しているのではないかと仮説を立てた。実際、重みの刈込のみで、暗

    JSAI2024参加記録 - 英語帝国を打倒しよう