並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

拡散モデルの検索結果1 - 12 件 / 12件

  • 拡散モデルと最適輸送 - ジョイジョイジョイ

    『最適輸送の理論とアルゴリズム』が重版して第 5 刷となりました。皆さまありがとうございます! 漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、最近話題の拡散モデルと最適輸送の関係を直観的に解説します。 拡散モデルは画像の生成によく用いられる生成モデルです。モデルはノイズ入りの画像を受け取り、ノイズを除去することを目指します。生成時には、完全なノイズ画像からはじめて、モデルによりノイズを除去することと、微小なノイズを加えることを繰り返して洗練させていき、自然画像を得ます。 拡散モデルの動作の図示 このように、ノイズ から自然画像 までゆらぎながら変化する過程をブラウン橋 (Brownian bridge) と言います。ブラウン運動 (Brow

      拡散モデルと最適輸送 - ジョイジョイジョイ
    • 拡散モデルを用いた2Dバーチャル試着技術について - BASEプロダクトチームブログ

      はじめに こんにちは。BASEのデータ分析チーム(Data Strategy Team)で不正対策を行ったり、機械学習モデルを触ったりしている竹内です。 先日チーム内の論文読み会でニューラルネットを用いた画像合成によるバーチャル試着技術というトピックに触れる機会があったので、その最近のトレンドについて改めてブログという形でまとめてみました。 バーチャル試着は画像生成モデルの実用的なユースケースの一つとして今現在データセットの拡充やアーキテクチャの検証が進んでいる分野の一つであり、個人的には非常にアツいトピックだと感じています。 バーチャル試着とは バーチャル試着(Virtual Try On)とは、ある人物がある衣服を着用した状態を画像や3Dモデルなどの情報をもとに仮想的に実現し、どのように見えるか可視化する技術のことです。 ネットショップの普及により、店頭に出向かずともPCやスマートフォ

        拡散モデルを用いた2Dバーチャル試着技術について - BASEプロダクトチームブログ
      • 拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説

        画像生成AIの存在はすでに当たり前のものになりつつあります。広告やメディアに掲載されているイラストや写真のほか、私たちが普段使っている検索エンジンやブラウザにも搭載されるようになり、気軽に新しい画像を作れるようになりました。このような画像生成AIの急速な普及の背景にあるのが、画像生成AIの学習モデルに採用された「拡散モデル」の存在です。現在、ほとんどの画像生成AIサービスに採用されている「Stable Diffusion」もこの拡散モデルの1つです。本記事では、拡散モデルとは何か、仕組みや事例についてやさしく解説していきます。 合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・

          拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説
        • SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜

          バスのサービスレベル向上と運賃策による熊本都市圏の渋滞緩和効果推計 ~公共交通への公的投資に向けた感度と集計QVに基づく迅速なシナリオ検討~

            SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜
          • Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

            この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第58回)では、先日OpenAIが発表した「SearchGPT」など、Webのタイムリーな情報と大規模言語モデルを組みわせた検索AIのオープンソースモデル「MindSearch」や、Stability AIが発表した、単一の入力画像から3Dメッシュを0.5秒で生成する「Stable Fast 3D」を取り上げます。 Preferred Networks(PFN)の子会社Preferred Elements(PFE)は、独自開発の国産大規模言語モデル「PLaMo」(プラモ)を発表しました。日本語性能においてGPT-4を上回る精度を達成しています。商用版のPLaMo 1.0 Primeは今秋リリース予定とし、現在はβ版の無料トライアルの申し込みを受け付けています。 さて、この1週間の気になる生成AI技術をピック

              Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
            • 簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場

              スタンフォード大学やGoogleの研究チームが、テキストから写実的な動画を生成する拡散モデルである「W.A.L.T」を発表しました。実際に「W.A.L.T」を使用して生成した動画も多数公開されています。 W.A.L.T.pdf https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf Photorealistic Video Generation with Diffusion Models https://walt-video-diffusion.github.io/ 「W.A.L.T」は、Googleなどが発表した深層学習モデルのTransformerをベースにした動画生成AIです。研究チームのアグリム・グプタ氏は、W.A.L.Tの仕組みについてX(旧Twitter)へのポストで触れています。 We introduce W.A.L

                簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場
              • Googleが新たな動画生成技術「VideoPoet」を発表ーー拡散モデルではなくLLMを活用 | Ledge.ai

                サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                  Googleが新たな動画生成技術「VideoPoet」を発表ーー拡散モデルではなくLLMを活用 | Ledge.ai
                • 拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説(ビジネス+IT) - Yahoo!ニュース

                  画像生成AIの存在はすでに当たり前のものになりつつあります。広告やメディアに掲載されているイラストや写真のほか、私たちが普段使っている検索エンジンやブラウザにも搭載されるようになり、気軽に新しい画像を作れるようになりました。このような画像生成AIの急速な普及の背景にあるのが、画像生成AIの学習モデルに採用された「拡散モデル」の存在です。現在、ほとんどの画像生成AIサービスに採用されている「Stable Diffusion」もこの拡散モデルの1つです。本記事では、拡散モデルとは何か、仕組みや事例についてやさしく解説していきます。 【詳細な図や写真】拡散モデルが学ぶデータの拡散過程と逆拡散過程のイメージ(出典:筆者作成) 拡散モデルとは? データの破壊と修復を学ぶモデル 拡散モデル(Diffusion Model)とは、画像生成AIに採用されている学習モデルの1つであり、データの拡散過程(ノイ

                    拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説(ビジネス+IT) - Yahoo!ニュース
                  • Optimal Transport Conditional Flow Matching - 拡散モデルに取って代わる次世代の生成技術?

                    Optimal Transport Conditional Flow Matching - 拡散モデルに取って代わる次世代の生成技術? こんにちは!Fusic 機械学習チームの鷲崎です。最近、音声や言語処理に興味がありますが、機械学習モデルの開発からMLOpsまでなんでもしています。もし、機械学習で困っていることがあれば、気軽にDMください。 本記事では、Flow Matching (FM)と、その発展版であるOptimal Transport Conditional Flow Matching (OT-CFM)を解説します。最近の生成AIでは、拡散モデルがよく使用されていますが、Flow Matchingは、拡散モデルに取って代わる可能性がある生成技術と考えています。 おもに、Improving and Generalizing Flow-Based Generative Models

                      Optimal Transport Conditional Flow Matching - 拡散モデルに取って代わる次世代の生成技術?
                    • 拡散モデルによる分子デザイン①: 同変グラフ拡散モデルの実装 - どこから見てもメンダコ

                      同変グラフ畳み込み拡散モデル(EDM: E(3) Equivariant Diffusion Model)による分子生成をtf2で実装します。 同変グラフ拡散モデルによる分子生成 拡散モデルによる分子デザイン 拡散モデルの優位性 ① 学習安定性が高く、大きく複雑な構造生成が可能 ② 高精度な条件付け生成により、実務的な分子デザインが可能 創薬・材料科学分野で広がる応用 EDM:同変グラフ畳み込み拡散分子生成モデル 同変グラフ畳み込みネットワーク 並進・回転同変性の獲得 拡散モデルとの組み合わせ TF2での実装 QM9データセットの入手 分子構造をネットワーク入力用にフォーマット 同変グラフ畳み込みネットワーク 拡散モデルのトレーニング 生成結果 参考文献 拡散モデルによる分子デザイン 拡散モデル(Diffusion Model)を利用した画像生成が、GPTなど大規模言語モデル(LLM)と並

                        拡散モデルによる分子デザイン①: 同変グラフ拡散モデルの実装 - どこから見てもメンダコ
                      • 【拡散モデル勉強会】拡散モデルの数理 | ドクセル

                        【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

                          【拡散モデル勉強会】拡散モデルの数理 | ドクセル
                        • 拡散モデルによる画像生成(CVIMチュートリアル)

                          2023年5月開催の情報処理学会CVIM研究会において行ったチュートリアル講演の資料です。 拡散モデルによる画像生成について、「拡散モデルの原理と学習方法」「生成処理の制御(画像変換・編集への応用)」「生成処理の高速化(微分方程式との関係)」の3つに分けて解説しています。

                            拡散モデルによる画像生成(CVIMチュートリアル)
                          1