タグ

ブックマーク / joisino.hatenablog.com (2)

  • 言語モデルの物理学 - ジョイジョイジョイ

    言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。 言語モデルの物理学の特徴は大きく2つあります。 第一は、ウェブから収集したコーパスを使わず、きっちりコントロールされたデータセットを使って言語モデルを訓練するということ。ウェブは誰も全体像を理解できないほど複雑で、ノイズにまみれています。物の物理学でも空気抵抗や摩擦があると、「鉄球は

    言語モデルの物理学 - ジョイジョイジョイ
    rgfx
    rgfx 2025/03/25
  • 人間には認知できない情報を活用するAIたち - ジョイジョイジョイ

    正月休みに Twitter(現 X)を眺めていると面白いポストを見かけました。 これまで人類は真理とは単純なものであると考えて、 や のような単純な真理を追いかけてきたわけですが、このようなものは実は真理のうちのごく一部であり、人間には理解できないほど複雑な真理もあるのではないかという考え方です。 ❌「AIが人間より質的量的に賢くなったら人間には理解しきれなくなる」 ⭕️「この世界はもともと人間には理解しきれない構造になっていて、AIはそこを扱えるようになる」 みたいな世界観を持っていたほうが良さそうな気がする— すきえんてぃあ@書け (@cicada3301_kig) 2024年12月31日 似た話が 2018 年頃に敵対的摂動の文脈で議論されているのですが、稿ではそのあたりの話を最近の文脈に絡めてお話します。 目次 目次 AI は人間には認知できない情報を活用できる 微弱な情報を活用

    人間には認知できない情報を活用するAIたち - ジョイジョイジョイ
    rgfx
    rgfx 2025/01/16
  • 1