rgfxのブックマーク - はてなブックマーク

言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。言語モデルの物理学の特徴は大きく2つあります。第一は、ウェブから収集したコーパスを使わず、きっちりコントロールされたデータセットを使って言語モデルを訓練するということ。ウェブは誰も全体像を理解できないほど複雑で、ノイズにまみれています。本物の物理学でも空気抵抗や摩擦があると、「鉄球は
rgfx 2025/03/25
LLM
リンク
人間には認知できない情報を活用するAIたち - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
正月休みに Twitter（現 X）を眺めていると面白いポストを見かけました。これまで人類は真理とは単純なものであると考えて、やのような単純な真理を追いかけてきたわけですが、このようなものは実は真理のうちのごく一部であり、人間には理解できないほど複雑な真理もあるのではないかという考え方です。 ❌「AIが人間より質的量的に賢くなったら人間には理解しきれなくなる」 ⭕️「この世界はもともと人間には理解しきれない構造になっていて、AIはそこを扱えるようになる」みたいな世界観を持っていたほうが良さそうな気がする— すきえんてぃあ@書け (@cicada3301_kig) 2024年12月31日似た話が 2018 年頃に敵対的摂動の文脈で議論されているのですが、本稿ではそのあたりの話を最近の文脈に絡めてお話します。目次目次 AI は人間には認知できない情報を活用できる微弱な情報を活用
rgfx 2025/01/16
リンク
1

はてなブックマーク

タグ

ブックマーク / joisino.hatenablog.com (2)

お知らせ

今週のはてなブックマーク数ランキング（2025年6月第1週）

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / joisino.hatenablog.com (2)

言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

人間には認知できない情報を活用するAIたち - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

お知らせ

今週のはてなブックマーク数ランキング（2025年6月第1週）

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス