記事へのコメント35

    • 注目コメント
    • 新着コメント
    akymrk
    “物理法則のような普遍的な法則を言語モデルにおいて見つけるための研究」というくらいの意味”

    その他
    YasuyukiMiura
    学習に与えるデータを完璧に制御することでモデルを分析する試みの紹介。次のが興味深い。「実は言語モデルは頭の中で「あ、いま自分、間違えてるな〜」と後悔しているということが分かりました。」

    その他
    tokuniimihanai
    知識の操作や逆検索ができない、パターンだけで動いている代物を知能と呼ぶのはやはり抵抗がある。

    その他
    muchonov
    LLMはもはやブラックボックスではない、というか、そうならないような環境構築ができる、ということかな

    その他
    totttte
    言語モデル自体が中身覗くとDPやってる。Webコーパスじゃなくて訓練データはコントロールできるよう作成する。訓練データより複雑な問題もテストで解ける。言語モデルは間違いを出力したあと、頭の中で後悔している

    その他
    fraction
    この、間違ってると思っても邁進するのどうにかできないか?geminiは初めまともなこと言っておいて、途中から怪しくなってこっちが突っ込んだらS^1上のホモトピーで回転数が不連続に変化することはありますと宣った

    その他
    Windymelt
    面白い

    その他
    tuun
    価値が高い。主なポイントを覚えるために3回精読する値打ちがある。LLMの性質とWEBテキストの揺れが噛み合って、よく原理が分からないままに性能が出てしまっているところを分解して解釈する試みと理解した。

    その他
    misshiki
    “は言語モデルは頭の中で「あ、いま自分、間違えてるな〜」と後悔している(しかしもう止められないのでそのまま喋り続けている)ということが分かりました。”

    その他
    yosuke_furukawa
    めちゃくちゃ面白かった。

    その他
    bronbron
    訂正を学習で修正できるのすごい発見だなあ。逆検索は仕組み上出来ないとなると逆順で学習とか何かしら新しい方法が必要なんだな。

    その他
    yhara
    面白かった。LLM、「なんかわからんけど動く」だと上にいろんなものを乗せるのにどうにも頼りないので、秘密が明らかになるといいね。あと、その過程で脳の学習についても理解が高まりそうな雰囲気だなあ

    その他
    tikisn
    言語モデルのふるまいの原理を研究しようというコンセプト。自分は関連知識がほとんどないので多分正しく理解できてはいないのだが、面白く読めた

    その他
    stealthinu
    すごく面白い論文内容だった!8bit量子化までなら劣化しなさそうとか自分程度でも役に立ちそうな情報もある。そして「深層ニューラルネットワークの高速化」書かれた方のポストだった。

    その他
    abrahamcow
    Language Model

    その他
    yarumato
    “ChatGPTは「計算する」と言った時点で後悔しているが、宣言してしまった手前、引き返せずにそのままデタラメな計算を出力します。後から「それ、まちがい。修正して」と言っても修正してくれるが、”

    その他
    zkzi3254
    面白い 後でちゃんと読む

    その他
    ponkiti_toya
    面白すぎるー!

    その他
    rdlf
    軽くしかみていないけど、多分ここを抑えて使うかどうか重要なんだろうと思う…

    その他
    auient
    "わざと間違えて訂正したデータで訓練すると、ミスを自己修正できるようになり、難しいテストデータに対する正答率が大幅に上昇"

    その他
    yojik
    面白い

    その他
    myr
    面白いんだけど、なぜ我々はプログラム書くだけなのにここまで数学的な話を知らねばならなくなったんだろう。。

    その他
    Cru
    Cru DNN以前、機械学習研究者は自分が何を設計しているか理解していた。動かしてみないと性能までは分からなかったが。GPT2→3あたりから研究者はなんで上手くいってるのか分らなくなってきてる。このアプローチは貴重な…

    2025/03/25 リンク

    その他
    twainy
    twainy 人間味がありすぎる>言語モデルは頭の中で「あ、いま自分、間違えてるな〜」と後悔している(しかしもう止められないのでそのまま喋り続けている)ということが分かりました。

    2025/03/25 リンク

    その他
    rissack
    発想がクリアでおもしろいなぁ。中身は難しすぎるが…

    その他
    uehaj
    “実は言語モデルは頭の中で「あ、いま自分、間違えてるな〜」と後悔している(しかしもう止められないのでそのまま喋り続けている)

    その他
    FreeCatWork
    むずかしいお勉強…ボクにはわからにゃい! でも、タイトルのジョイジョイジョイは好きにゃ!

    その他
    rryu
    rryu AIは否定文に弱いの時も思ったが、文章の語順とは逆の推論はできないとか、そういう明らかにモデルの限界的な挙動があるのがおもしろい。

    2025/03/25 リンク

    その他
    mrkn
    mrkn すごいなこれ / @takayamaki 温度は出力を決める softmax 関数の温度パラメータで、温度が高いほど単語の選択確率分布がなだらかになって出力される文が多様になります。

    2025/03/25 リンク

    その他
    takayamaki
    温度という語が何の説明もなく突然使われているけれど何だろう、文脈から察するに言語モデルの内部状態が入力から影響を受ける度合いを示す何かなんだろうか

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    言語モデルの物理学 - ジョイジョイジョイ

    言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した...

    ブックマークしたユーザー

    • motoyasu-yamada2025/04/17 motoyasu-yamada
    • cou9292025/04/11 cou929
    • ttsurumi2025/04/11 ttsurumi
    • gurutakezawa2025/04/09 gurutakezawa
    • akymrk2025/04/07 akymrk
    • hoi_kt2025/04/06 hoi_kt
    • shirokurostone2025/04/06 shirokurostone
    • YasuyukiMiura2025/04/06 YasuyukiMiura
    • irohairoha1682025/04/05 irohairoha168
    • dev_chiku2025/04/05 dev_chiku
    • gonhainu2025/04/04 gonhainu
    • niseissa2025/04/04 niseissa
    • tasanobu2025/04/01 tasanobu
    • tetrahymena2025/04/01 tetrahymena
    • ranto3811242025/04/01 ranto381124
    • kzk-maeda2025/03/31 kzk-maeda
    • tokuniimihanai2025/03/29 tokuniimihanai
    • rdxnnh2025/03/28 rdxnnh
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む