はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    ブラックフライデー

『Lil'Log』

  • 人気
  • 新着
  • すべて
  • Why We Think

    3 users

    lilianweng.github.io

    Date: May 1, 2025 | Estimated Reading Time: 40 min | Author: Lilian Weng Special thanks to John Schulman for a lot of super valuable feedback and direct edits on this post. Test time compute (Graves et al. 2016, Ling, et al. 2017, Cobbe et al. 2021) and Chain-of-thought (CoT) (Wei et al. 2022, Nye et al. 2021), have led to significant improvements in model performance, while raising many research

    • テクノロジー
    • 2025/05/19 22:05
    • 機械学習
    • programming
    • LLM Powered Autonomous Agents

      10 users

      lilianweng.github.io

      Date: June 23, 2023 | Estimated Reading Time: 31 min | Author: Lilian Weng Building agents with LLM (large language model) as its core controller is a cool concept. Several proof-of-concepts demos, such as AutoGPT, GPT-Engineer and BabyAGI, serve as inspiring examples. The potentiality of LLM extends beyond generating well-written copies, stories, essays and programs; it can be framed as a powerfu

      • テクノロジー
      • 2023/06/26 17:51
      • LLM
      • AI
      • language
      • Attention? Attention!

        3 users

        lilianweng.github.io

        Date: June 24, 2018 | Estimated Reading Time: 21 min | Author: Lilian Weng [Updated on 2018-10-28: Add Pointer Network and the link to my implementation of Transformer.] [Updated on 2018-11-06: Add a link to the implementation of Transformer model.] [Updated on 2018-11-18: Add Neural Turing Machines.] [Updated on 2019-07-18: Correct the mistake on using the term “self-attention” when introducing t

        • 世の中
        • 2023/03/22 02:03
        • Prompt Engineering

          21 users

          lilianweng.github.io

          Date: March 15, 2023 | Estimated Reading Time: 21 min | Author: Lilian Weng Prompt Engineering, also known as In-Context Prompting, refers to methods for how to communicate with LLM to steer its behavior for desired outcomes without updating the model weights. It is an empirical science and the effect of prompt engineering methods can vary a lot among models, thus requiring heavy experimentation a

          • テクノロジー
          • 2023/03/20 06:31
          • PromptEngineering
          • あとで読む
          • AI
          • 機械学習
          • The Transformer Family Version 2.0

            3 users

            lilianweng.github.io

            Date: January 27, 2023 | Estimated Reading Time: 45 min | Author: Lilian Weng Many new Transformer architecture improvements have been proposed since my last post on “The Transformer Family” about three years ago. Here I did a big refactoring and enrichment of that 2020 post — restructure the hierarchy of sections and improve many sections with more recent papers. Version 2.0 is a superset of the

            • テクノロジー
            • 2023/01/30 12:13
            • Large Transformer Model Inference Optimization

              4 users

              lilianweng.github.io

              Date: January 10, 2023 | Estimated Reading Time: 9 min | Author: Lilian Weng [Updated on 2023-01-24: add a small section on Distillation.] Large transformer models are mainstream nowadays, creating SoTA results for a variety of tasks. They are powerful but very expensive to train and use. The extremely high inference cost, in both time and memory, is a big bottleneck for adopting a powerful transf

              • テクノロジー
              • 2023/01/12 15:09
              • Contrastive Representation Learning

                4 users

                lilianweng.github.io

                Date: May 31, 2021 | Estimated Reading Time: 39 min | Author: Lilian Weng The goal of contrastive representation learning is to learn such an embedding space in which similar sample pairs stay close to each other while dissimilar ones are far apart. Contrastive learning can be applied to both supervised and unsupervised settings. When working with unsupervised data, contrastive learning is one of

                • テクノロジー
                • 2022/09/27 10:06
                • CLIP
                • What are Diffusion Models?

                  15 users

                  lilianweng.github.io

                  Date: July 11, 2021 | Estimated Reading Time: 31 min | Author: Lilian Weng [Updated on 2021-09-19: Highly recommend this blog post on score-based generative modeling by Yang Song (author of several key papers in the references)]. [Updated on 2022-08-27: Added classifier-free guidance, GLIDE, unCLIP and Imagen. [Updated on 2022-08-31: Added latent diffusion model. [Updated on 2024-04-13: Added prog

                  • テクノロジー
                  • 2022/04/08 13:41
                  • generative_model
                  • dl
                  • deep learning
                  • deeplearning
                  • 機械学習
                  • AI
                  • diffusion models
                  • generative model
                  • Contrastive Representation Learning

                    5 users

                    lilianweng.github.io

                    • 暮らし
                    • 2021/07/13 10:01
                    • あとで読む
                    • The Transformer Family

                      3 users

                      lilianweng.github.io

                      "> ← Curriculum For Reinforcement Learning Exploration Strategies In Deep Reinforcement Learning →

                      • テクノロジー
                      • 2020/04/09 17:30
                      • AI
                      • Self Supervised Learning

                        4 users

                        lilianweng.github.io

                        • 暮らし
                        • 2019/11/13 13:59
                        • Are Deep Neural Networks Dramatically Overfitted

                          11 users

                          lilianweng.github.io

                          • テクノロジー
                          • 2019/03/22 15:35
                          • 機械学習
                          • 論文
                          • Attention Attention

                            8 users

                            lilianweng.github.io

                            "> ← Implementing Deep Reinforcement Learning Models From Autoencoder To Beta Vae →

                            • 世の中
                            • 2019/03/02 07:45
                            • Generalized Language Models

                              3 users

                              lilianweng.github.io

                              • テクノロジー
                              • 2019/02/06 10:14
                              • 機械学習
                              • Policy Gradient Algorithms

                                5 users

                                lilianweng.github.io

                                • 世の中
                                • 2018/12/14 14:14
                                • Meta Learning

                                  13 users

                                  lilianweng.github.io

                                  "> ← Flow Based Deep Generative Models Object Detection Part 4 →

                                  • テクノロジー
                                  • 2018/12/14 12:40
                                  • 機械学習
                                  • Flow-based Deep Generative Models

                                    8 users

                                    lilianweng.github.io

                                    • テクノロジー
                                    • 2018/12/10 09:52
                                    • 機械学習
                                    • Normalizing Flow
                                    • From Autoencoder To Beta Vae

                                      17 users

                                      lilianweng.github.io

                                      • テクノロジー
                                      • 2018/09/07 14:25
                                      • VAE
                                      • deeplearning
                                      • 機械学習
                                      • まとめ
                                      • あとで読む
                                      • βVAE
                                      • A (Long) Peek into Reinforcement Learning

                                        9 users

                                        lilianweng.github.io

                                        • テクノロジー
                                        • 2018/08/23 20:38
                                        • 機械学習
                                        • From Gan To Wgan

                                          14 users

                                          lilianweng.github.io

                                          "> ← How To Explain The Prediction Of A Machine Learning Model Anatomize Deep Learning With Information Theory →

                                          • テクノロジー
                                          • 2018/02/05 09:04
                                          • GAN
                                          • 機械学習

                                          このページはまだ
                                          ブックマークされていません

                                          このページを最初にブックマークしてみませんか?

                                          『Lil'Log』の新着エントリーを見る

                                          キーボードショートカット一覧

                                          j次のブックマーク

                                          k前のブックマーク

                                          lあとで読む

                                          eコメント一覧を開く

                                          oページを開く

                                          はてなブックマーク

                                          • 総合
                                          • 一般
                                          • 世の中
                                          • 政治と経済
                                          • 暮らし
                                          • 学び
                                          • テクノロジー
                                          • エンタメ
                                          • アニメとゲーム
                                          • おもしろ
                                          • アプリ・拡張機能
                                          • 開発ブログ
                                          • ヘルプ
                                          • お問い合わせ
                                          • ガイドライン
                                          • 利用規約
                                          • プライバシーポリシー
                                          • 利用者情報の外部送信について
                                          • ガイドライン
                                          • 利用規約
                                          • プライバシーポリシー
                                          • 利用者情報の外部送信について

                                          公式Twitter

                                          • 公式アカウント
                                          • ホットエントリー

                                          はてなのサービス

                                          • はてなブログ
                                          • はてなブログPro
                                          • 人力検索はてな
                                          • はてなブログ タグ
                                          • はてなニュース
                                          • ソレドコ
                                          • App Storeからダウンロード
                                          • Google Playで手に入れよう
                                          Copyright © 2005-2025 Hatena. All Rights Reserved.
                                          設定を変更しましたx