並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 38 件 / 38件

新着順 人気順

拡散モデルの検索結果1 - 38 件 / 38件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

拡散モデルに関するエントリは38件あります。 AI機械学習画像 などが関連タグです。 人気エントリには 『拡散モデルで将棋の方策を学習する - TadaoYamaokaの開発日記』などがあります。
  • 拡散モデルで将棋の方策を学習する - TadaoYamaokaの開発日記

    拡散モデルで、将棋の方策を学習できないか試してみた。 拡散モデル 拡散モデルは、高品質で多様なサンプルを生成できる生成モデルである。 昨年8月にStable Diffusionが公開されたことで注目を集めている。 拡散モデルは、確率微分方程式によって表される確率分布を近似するモデルで、モード崩壊を起こさず多様な分布を学習できるという特徴がある。 また、プロンプトと呼ばれるテキストにより条件付けを行い、テキストに従った画像を生成できる。 将棋の方策 将棋の方策は、座標と移動方向の組み合わせで表現でき、dlshogiで採用している表現方法では2187次元になる。 つまり、指し手は、局面によって条件づけられた2187次元の確率分布からサンプリングを行っていることになる。 拡散モデルの可能性 条件付けを行い高次元の確率分布からサンプリングを行うという仕組みは、将棋の方策においても適用できると考える

      拡散モデルで将棋の方策を学習する - TadaoYamaokaの開発日記
    • 画像生成 AI の最前線!拡散モデル・画像生成モデルの最新研究を解説

        画像生成 AI の最前線!拡散モデル・画像生成モデルの最新研究を解説
      • DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事

        1.DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事まとめ ・拡散モデルは画像に加えたノイズを除去して元画像を復元する事を学習をする ・学習済モデルは純粋なノイズから画像を復元できるようになりこれが画像生成 ・学習時のノイズはガウスノイズの必要があると思われていたがそうではなかった 2.拡散モデルの動作原理とは? 以下、twitterのTom Goldstein(@tomgoldsteincs)さんの拡散モデルの動作原理に関する投稿の意訳です。昨日の調査をしている際に見つけた一連のtweetでわかりやすくとても興味深い解説でした。 アイキャッチ画像はstable diffusion #DALLEや#StableDiffusionのような拡散モデルは画像生成の最先端ですが、それらがどのようにして動作しているかの理解はまだ始まったばかりです。このスレッ

          DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事
        • 拡散モデルと最適輸送 - ジョイジョイジョイ

          『最適輸送の理論とアルゴリズム』が重版して第 5 刷となりました。皆さまありがとうございます! 漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、最近話題の拡散モデルと最適輸送の関係を直観的に解説します。 拡散モデルは画像の生成によく用いられる生成モデルです。モデルはノイズ入りの画像を受け取り、ノイズを除去することを目指します。生成時には、完全なノイズ画像からはじめて、モデルによりノイズを除去することと、微小なノイズを加えることを繰り返して洗練させていき、自然画像を得ます。 拡散モデルの動作の図示 このように、ノイズ から自然画像 までゆらぎながら変化する過程をブラウン橋 (Brownian bridge) と言います。ブラウン運動 (Brow

            拡散モデルと最適輸送 - ジョイジョイジョイ
          • 拡散モデルを用いた2Dバーチャル試着技術について - BASEプロダクトチームブログ

            はじめに こんにちは。BASEのデータ分析チーム(Data Strategy Team)で不正対策を行ったり、機械学習モデルを触ったりしている竹内です。 先日チーム内の論文読み会でニューラルネットを用いた画像合成によるバーチャル試着技術というトピックに触れる機会があったので、その最近のトレンドについて改めてブログという形でまとめてみました。 バーチャル試着は画像生成モデルの実用的なユースケースの一つとして今現在データセットの拡充やアーキテクチャの検証が進んでいる分野の一つであり、個人的には非常にアツいトピックだと感じています。 バーチャル試着とは バーチャル試着(Virtual Try On)とは、ある人物がある衣服を着用した状態を画像や3Dモデルなどの情報をもとに仮想的に実現し、どのように見えるか可視化する技術のことです。 ネットショップの普及により、店頭に出向かずともPCやスマートフォ

              拡散モデルを用いた2Dバーチャル試着技術について - BASEプロダクトチームブログ
            • 拡散モデルチュートリアル_for_public.pdf

              ログイン読み込んでいます…

              • 拡散モデルを使用して白黒画像をカラー化する「Color Diffusion」

                白黒画像をカラー化する「Color Diffusion」のプロジェクトがGitHubにて公開されています。 ErwannMillon/Color-diffusion: A diffusion model to colorize black and white images https://github.com/ErwannMillon/Color-diffusion Color Diffusion: Colorizing Black and White Images with Diffusion Models | by Erwann | Medium https://medium.com/@erwannmillon/color-diffusion-colorizing-black-and-white-images-with-diffusion-models-269828f71c81 以下が

                  拡散モデルを使用して白黒画像をカラー化する「Color Diffusion」
                • 拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説

                  画像生成AIの存在はすでに当たり前のものになりつつあります。広告やメディアに掲載されているイラストや写真のほか、私たちが普段使っている検索エンジンやブラウザにも搭載されるようになり、気軽に新しい画像を作れるようになりました。このような画像生成AIの急速な普及の背景にあるのが、画像生成AIの学習モデルに採用された「拡散モデル」の存在です。現在、ほとんどの画像生成AIサービスに採用されている「Stable Diffusion」もこの拡散モデルの1つです。本記事では、拡散モデルとは何か、仕組みや事例についてやさしく解説していきます。 合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・

                    拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説
                  • 拡散モデルに言語創作をしてほしいなぁ - hsjoihs’s diary

                    この記事は創作+機械学習 Advent Calendar 2022 の 25 日目の記事です。ところで今は 2022 年 12 月 31 日です。おやぁ。 遅刻しておきながら、実際に計算機を回したりしているわけではない、ある意味少し的はずれな記事内容になってしまい申し訳ありません。一方で、比較的ユニークな話題をこのアドベントカレンダーに持ち込むことができるように努力したので、楽しんでいただければ幸いです。 なお、昨年度は 『架空世界の表意文字用の手書き文字認識を実装したい (part 1)』という記事で創作+機械学習 Advent Calendar 2021 に参加したのですが*1、今年の記事の内容はこの去年の記事と関連があるので、そちらも合わせてお読みいただけるとさらに楽しめるかもしれません。 hsjoihs.hatenablog.com 以下常体で書きます。 想定読者層 言語は一様乱数

                      拡散モデルに言語創作をしてほしいなぁ - hsjoihs’s diary
                    • [書評] 拡散モデル データ生成技術の数理 ー 目覚ましい画像生成の発展の裏側を知りたい人へ - まったり勉強ノート

                      どんな本か? Stable Diffusionをはじめとした画像生成技術が劇的に進化して実際に人が書いたような絵が生成できるようになり、画像生成を使ってみたという話をよく聞くようになりました。このStable Diffusionなどの画像生成技術を大きく進歩させた技術が今回の本で紹介されている「拡散モデル」です。 この本ではこの拡散モデルの背景にある数式をわかりやすく説明してくれています。また、拡散モデルの応用先として画像生成が有名ですが、他の生成モデルにはない拡散モデルならではの特徴とその特徴が生かされた他の生成モデル(例えば化合物とか)についても説明がされています。 どんな人におすすめか? この本は以下のようなことに興味ある人が最初に読むと良い本かなと思います。 Stable Diffusionはどういう数学的背景がどうなっているのか?知りたい 拡散モデルについて知らないけど、何に使え

                      • 最近話題の"Diffusion Model(拡散モデル)"について、簡潔にまとめてみた - AI・セキュリティのまとめのまとめ

                        OpenAIが先日発表したGLIDEにDiffusion Moldelが使用されているとのことで、最近話題のDiffusion Model(拡散モデル)について、まとめました。 サマリー 生成モデルとは Diffusion Model(拡散モデル)とは Forward diffusion process Reverse diffusion process 学習 応用例 画像生成 条件付き画像生成 画像変換 参考文献 サマリー ・Diffusion Model(拡散モデル)は、元データにノイズが徐々に付加されていき、最終的にガウシアンノイズとなるという前提を置き、その逆のプロセスをモデル化することでデータを生成する。 ・GANやVAEよりも高品質の画像を生成することに成功しており、様々な分野への応用が期待される。 生成モデルとは 生成モデルを使用することで、データ(ex. 画像)の生成プロセ

                          最近話題の"Diffusion Model(拡散モデル)"について、簡潔にまとめてみた - AI・セキュリティのまとめのまとめ
                        • 拡散モデルについて思ったこと、統計モデリング等との関係 - xiangze's sparse blog

                          久しぶりの投稿になります その間世の中では様々なことが起こりましたがStable diffusion,novelAI, DALL-e, midjourneyなど画像生成AIの流行もその一つです。 画像生成AIの性能の中核とも言える拡散モデルに関して他の機械学習手法との関連、そして多くのアイデアの源泉となった非平衡統計物理学,統計モデリング、進化生物学などとの関係に関して思ったことを書きます。 ためになる論文、本のリンクも貼ります。 目次 目次 score matchingとの関係 他の生成モデルとの関係 非平衡統計物理学との関係 統計モデリングの手法との共通点、相違点 情報幾何との関係 進化生物学との関係 専用ハードウェアへのヒント? なぜ拡散モデルはうまくいくのか コンテンツ生成以外の応用 その他 Next Step(ToDo) ためになるリンク 英語 ためになる本 Fitness la

                            拡散モデルについて思ったこと、統計モデリング等との関係 - xiangze's sparse blog
                          • SSII2023 [SS1] 拡散モデルの基礎とその応用 ~Diffusion Models入門~

                            スポーツメトリクス設計に対比較法を使いまくる / Sports metrics design using pairwise comparison method (spoana#14)

                              SSII2023 [SS1] 拡散モデルの基礎とその応用 ~Diffusion Models入門~
                            • Googleショッピングに生成AI(拡散モデル)採用バーチャル試着機能(まず米国で)

                              Googleは、ショッピング検索の生成AI採用のバーチャル試着機能を発表した。まずは米国で、H&Mなど一部のブランドの女性用衣服で利用できるようになった。「DALL・E2」などのベースになる「拡散モデル」で開発した。 米Googleは6月14日(現地時間)、生成AI採用のバーチャル試着機能「Virtual try-on」(VTO)をまずは米国で公開したと発表した。検索結果のAnthropologie、Everlane、H&M、LOFTなどのブランドの服の画像に「Try On」バッジが表示される場合に利用できる。 試着と言っても、自分で着るわけではなく、自分の体型や肌の色に近いモデルを選んでそのモデルに目的の服を着せて見るというものだ。 VTOは、「拡散モデル」を採用した生成AIツールだ。拡散モデルは、「DALL・E2」や「Stable Diffusion」、Googleの「Imagen」な

                                Googleショッピングに生成AI(拡散モデル)採用バーチャル試着機能(まず米国で)
                              • 拡散モデルの基礎と研究事例: Imagen - Qiita

                                1. はじめに 深層学習ベースの有名な生成モデルとしては、GANやVAEなどがよく知られています。近年、これらとは異なるアプローチをとる生成モデルとして、拡散モデルに関する研究が盛んになっています。特に文献[6]では定量的評価・定性的評価の両面で、拡散モデルによる画像生成品質がBigGANを超えたと報告されました。画像生成以外でも、音声合成(文献[13], [20])やテキスト処理(文献[12], [21])、ロボット制御(文献[20])などの種々のタスクへの応用事例が報告されており、ますます注目度の高い技術になっています。 本記事では、拡散モデルの代表であるdenoising diffusion probabilistic model(DDPM)による画像生成の理論的側面と、研究事例としてImagen [18]を紹介します。 2. 拡散モデルの基礎 2-1. 拡散過程・逆拡散過程の導入

                                  拡散モデルの基礎と研究事例: Imagen - Qiita
                                • 簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場

                                  スタンフォード大学やGoogleの研究チームが、テキストから写実的な動画を生成する拡散モデルである「W.A.L.T」を発表しました。実際に「W.A.L.T」を使用して生成した動画も多数公開されています。 W.A.L.T.pdf https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf Photorealistic Video Generation with Diffusion Models https://walt-video-diffusion.github.io/ 「W.A.L.T」は、Googleなどが発表した深層学習モデルのTransformerをベースにした動画生成AIです。研究チームのアグリム・グプタ氏は、W.A.L.Tの仕組みについてX(旧Twitter)へのポストで触れています。 We introduce W.A.L

                                    簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場
                                  • SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜

                                    Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3

                                      SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜
                                    • Googleが新たな動画生成技術「VideoPoet」を発表ーー拡散モデルではなくLLMを活用 | Ledge.ai

                                      サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                        Googleが新たな動画生成技術「VideoPoet」を発表ーー拡散モデルではなくLLMを活用 | Ledge.ai
                                      • 拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説(ビジネス+IT) - Yahoo!ニュース

                                        画像生成AIの存在はすでに当たり前のものになりつつあります。広告やメディアに掲載されているイラストや写真のほか、私たちが普段使っている検索エンジンやブラウザにも搭載されるようになり、気軽に新しい画像を作れるようになりました。このような画像生成AIの急速な普及の背景にあるのが、画像生成AIの学習モデルに採用された「拡散モデル」の存在です。現在、ほとんどの画像生成AIサービスに採用されている「Stable Diffusion」もこの拡散モデルの1つです。本記事では、拡散モデルとは何か、仕組みや事例についてやさしく解説していきます。 【詳細な図や写真】拡散モデルが学ぶデータの拡散過程と逆拡散過程のイメージ(出典:筆者作成) 拡散モデルとは? データの破壊と修復を学ぶモデル 拡散モデル(Diffusion Model)とは、画像生成AIに採用されている学習モデルの1つであり、データの拡散過程(ノイ

                                          拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説(ビジネス+IT) - Yahoo!ニュース
                                        • 拡散モデル - 岩波書店

                                          拡散モデルはデータを生成できるモデル、いわゆる生成モデルの1つで、注目を集めている。拡散モデルはその生成品質の高さや用途の多様性だけでなく、これまでの生成モデルにはない高い拡張性があり、多くの分野で急速に使われ始めている。 拡散モデルを利用した成果の代表例は、2022年に登場した DALL-E2 やMidjourney、Stable Diffusion であろう。これらのサービス/ソフトウェアは、ユーザーが指定したテキストに対応する画像を生成する。その際、生成対象だけでなく、そのスタイルやテーマを自由に指定することができる。そのため世界中の多くのユーザーの注目を集めており、既に膨大な量の作品が生成されている。自然言語がカバーする膨大な対象、スタイル、テーマに対応する高品質な画像を生成できるこれらのサービスの技術の根幹が拡散モデルであり、そのポテンシャルの高さを示している。 拡散モデルは従来

                                            拡散モデル - 岩波書店
                                          • ピタッとくっつく3Dキャラクターの足と地面、より自然な動きに NVIDIAが物理ベースの拡散モデルを開発【研究紹介】

                                            NVIDIAに所属する研究者らが発表した論文「PhysDiff: Physics-Guided Human Motion Diffusion Model」は、物理法則を拡散プロセスに組み込むことで、物理的にありそうな動作を生成する、新しいモデルを提案した研究報告である。3DCGのキャラクターにおいて、足などが地面と接地する動きにおいて起きる、足の浮遊、足滑り、地面の貫通などの実世界ではありえない不自然な現象を改善した、よりリアルに近い動きの生成を行う。 ▲(左)本手法の出力結果。手足が地面と自然に相互作用している(右)従来のモデルの出力結果。手が地面にめり込み、足は浮いて不自然な表現になっている。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容 keyboard_arrow_down 実証実験 深層学習に基づく人体動作生成は、アニメーショ

                                              ピタッとくっつく3Dキャラクターの足と地面、より自然な動きに NVIDIAが物理ベースの拡散モデルを開発【研究紹介】
                                            • 拡散モデルを使用してGANより忠実度の高い画像を生成(1/2)

                                              1.拡散モデルを使用してGANより忠実度の高い画像を生成(1/2)まとめ ・画像合成は、GAN、VAE、自己回帰モデル等を使って行われているがどれも一長一短 ・2015年に発表された拡散モデルは安定性と生成サンプルの品質で最近注目を集めている ・拡散モデルを規模拡大しデータ拡張を行ってGANを超える強力な超解像画像の生成に成功 2.拡散モデルとは? 以下、ai.googleblog.comより「High Fidelity Image Generation Using Diffusion Models」の意訳です。元記事の投稿は2021年6月16日、Jonathan HoさんとChitwan Sahariaさんによる投稿です。 diffusion modelは「拡散過程モデル」と日本語訳しているケースも見かけたのですが、人工知能分野ではなく数学分野に見えたので、区別するために拡散モデルとして

                                                拡散モデルを使用してGANより忠実度の高い画像を生成(1/2)
                                              • Optimal Transport Conditional Flow Matching - 拡散モデルに取って代わる次世代の生成技術?

                                                こんにちは!Fusic 機械学習チームの鷲崎です。最近、音声や言語処理に興味がありますが、機械学習モデルの開発からMLOpsまでなんでもしています。もし、機械学習で困っていることがあれば、気軽にDMください。 本記事では、Flow Matching (FM)と、その発展版であるOptimal Transport Conditional Flow Matching (OT-CFM)を解説します。最近の生成AIでは、拡散モデルがよく使用されていますが、Flow Matchingは、拡散モデルに取って代わる可能性がある生成技術と考えています。 おもに、Improving and Generalizing Flow-Based Generative Models with Minibatch Optimal Transportという論文を参考に解説していきたいと思います。また、本記事の図は、論文か

                                                  Optimal Transport Conditional Flow Matching - 拡散モデルに取って代わる次世代の生成技術?
                                                • テキスト指示からリアルな立体物をつくる多視点拡散モデル「MVDream」 中国バイトダンスなどの研究者らが開発【研究紹介】

                                                  中国のバイトダンスと米国カリフォルニア大学サンディエゴ校に所属する研究者らと米国カリフォルニア大学サンディエゴ校に所属する研究者らが発表した論文「MVDream: Multi-view Diffusion for 3D Generation」は、テキストプロンプトから高品質な3Dモデルを生成する多視点拡散モデルを提案した研究報告である。与えられたテキストから、物や風景の多角度の画像を高精度に生成することができる。 ▲MVDreamを用い、テキストプロンプトから生成された3Dモデルのサンプル keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容 3Dオブジェクトは、今やゲームや映画、VRなど、多くのメディアで欠かせない要素となっている。しかし、この3Dオブジェクトを作成する過程は専門家が多くの時間を費やすほど難しい。 従来、3Dオブジェクトは主に

                                                    テキスト指示からリアルな立体物をつくる多視点拡散モデル「MVDream」 中国バイトダンスなどの研究者らが開発【研究紹介】
                                                  • 苦境深まる米メディアスタートアップ 「SNSで拡散」モデルに転機 - 日本経済新聞

                                                    米新興メディアの苦境が深まっている。最盛期には企業価値が円換算で8000億円に達したヴァイス・メディアは経営破綻し、バズフィードは報道部門を閉鎖した。SNS(交流サイト)各社の運営方針、読者のSNSへの接し方が共に変化したことで、インターネットの拡散力に頼った事業モデルは転機を迎えている。「市場環境の急速な悪化により新たな資金へのアクセスが制限を受け、適切な解決策を見いだすのが難しくなった」

                                                      苦境深まる米メディアスタートアップ 「SNSで拡散」モデルに転機 - 日本経済新聞
                                                    • 拡散モデルの整理 - Qiita

                                                      はじめに 拡散モデルは現在Text-to-imageの分野で主流なモデルである。 ところが初期や最新の拡散モデルに関する論文を一個読んだだけでは途中の拡散モデルの歴史や変化を追えないし、把握できない。そこで拡散モデルにおける変更を自分の理解を分野ごとに分けて整理してみた。 また、多段の拡散モデルの構成に関しては自記事「Diffusion modelは何故1個しかないのか?」も参考。 1.拡散過程 1.1.Denoising Diffusion Probabilistic Models(DDPM) Probabilistic(確率論的) 1.2.Denoising Diffusion Implicit Models(DDIM) Implicit(暗黙) DDPMは左のように徐々にノイズを与えて拡散過程を作る。DDIMは右のように一気にノイズを与えて拡散過程を作るという違いであると自分は理解を

                                                        拡散モデルの整理 - Qiita
                                                      • 《日経Robotics》拡散モデル:これまでにない生成品質と多様性を達成する生成モデル

                                                        この記事は日経Robotics 有料購読者向けの過去記事ですが 『日経Robotics デジタル版(電子版)』のサービス開始を記念して、特別に誰でも閲覧できるようにしています。 深層生成モデルの1つである拡散モデル(Diffusion Model)の利用が急速に広がっている。2015年に米Stanford UniversityのSohl-Dickstein氏らによって最初のモデルが提案されてから1)しばらく注目されていなかったが、2020年に米University of California BerkeleyのJonathan Ho氏ら2)によってネットワークアーキテクチャや学習手法を工夫すれば他の深層生成モデルと同じ、もしくは上回る品質を達成できること、またデノイジングスコアマッチングなどとつながりがあることが示され(本コラム 2020年9月号も参照)、再注目された。 拡散モデルは生成品

                                                          《日経Robotics》拡散モデル:これまでにない生成品質と多様性を達成する生成モデル
                                                        • 拡散モデル サポートページ

                                                          このサイトは「拡散モデル - データ生成技術の数理」に関する情報、訂正情報などを掲載します。誤りやコメントがありましたら サポートメール宛に送っていただけたら幸いです。 書誌情報 # 本書の試し読み(出版社ページ) ”多様で高品質な画像を生成し、人々を驚かせているアプリケーションは、どのような理論と技術により可能になったのか。従来は困難であった高次元のデータを創り出す生成モデルが注目されている。現在、最高の性能を発揮し、画像・動画・音声・化合物の生成など、多様な応用が期待されているのが拡散モデルである。その数理の本質から課題までを世界に先駆けて解説し、理論のさらなる発展を追究する。”(出版社紹介文より) タイトル:拡散モデル - データ生成技術の数理 - 著者: 岡野原 大輔 出版社:岩波書店 ページ数:148ページ 出版社ページ Amazon / 楽天ブックス / honto お知らせ

                                                          • 医療事故マンガ「脳外科医 竹田くん」がSNSで急拡散 モデルと指摘される病院を直撃すると…(日刊ゲンダイDIGITAL) - Yahoo!ニュース

                                                            神戸大医学部付属病院(神戸市)で、患者の検査時に放射線照射を行う資格のない複数の臨床工学技士が、X線装置を操作していたことが発覚。神戸大は「不適切な行為だった」として、病院関係者に法令を順守するよう注意喚起した──と24日付の読売新聞が報じた。 【写真】“シースルー看護師”が懲戒処分撤回後にモデルに抜擢され… 放射線は一度に大量に浴びると、吐き気などの症状が出る恐れがあり、診療放射線技師法では、放射線を人体に照射できるのは、医師と歯科医師、診療放射線技師に限定している。読売の記事によると、昨年12月大学に通報があり、聞き取り調査で判明したという。 通報がなければ問題が表面化せず、深刻な医療事故が起きた可能性があるため、ネット上では医療関係者とみられる人からの怒りの声が広がっているが、そのネット上で今、医療関係者だけでなく一般市民を震え上がらせ、ものすごい勢いで“大ヒット”している医療マンガ

                                                              医療事故マンガ「脳外科医 竹田くん」がSNSで急拡散 モデルと指摘される病院を直撃すると…(日刊ゲンダイDIGITAL) - Yahoo!ニュース
                                                            • 拡散モデルがモード崩壊しない理由 - Qiita

                                                              はじめに GAN(Generative Adversarial Network; 敵対的生成ネットワーク)のモード崩壊は、訓練中のGANがデータセットの多様性全体を捉えることができず、限られた数のサンプルまたは非常に似ているサンプルのみを生成するときに発生する問題を指します。この問題はGANの訓練の難しさとしてよく知られています。 モード崩壊の原因としては次のようなものが考えられています。 敵対的なフィードバックの不均衡: 生成器が特定のサンプルをうまく生成できると、それを繰り返し生成することで識別器を欺くのが簡単になる場合があります。その結果、生成器はデータセットのその他の多様性を学ぶ動機を失うことがあります。 学習率の不均衡: 生成器と識別器の学習率や更新速度が不均衡であると、モード崩壊が発生しやすくなります。 一方、2023年に流行している拡散モデルではモード崩壊するといったことはほ

                                                                拡散モデルがモード崩壊しない理由 - Qiita
                                                              • 拡散モデルによる分子デザイン①: 同変グラフ拡散モデルの実装 - どこから見てもメンダコ

                                                                同変グラフ畳み込み拡散モデル(EDM: E(3) Equivariant Diffusion Model)による分子生成をtf2で実装します。 同変グラフ拡散モデルによる分子生成 拡散モデルによる分子デザイン 拡散モデルの優位性 ① 学習安定性が高く、大きく複雑な構造生成が可能 ② 高精度な条件付け生成により、実務的な分子デザインが可能 創薬・材料科学分野で広がる応用 EDM:同変グラフ畳み込み拡散分子生成モデル 同変グラフ畳み込みネットワーク 並進・回転同変性の獲得 拡散モデルとの組み合わせ TF2での実装 QM9データセットの入手 分子構造をネットワーク入力用にフォーマット 同変グラフ畳み込みネットワーク 拡散モデルのトレーニング 生成結果 参考文献 拡散モデルによる分子デザイン 拡散モデル(Diffusion Model)を利用した画像生成が、GPTなど大規模言語モデル(LLM)と並

                                                                  拡散モデルによる分子デザイン①: 同変グラフ拡散モデルの実装 - どこから見てもメンダコ
                                                                • 《日経Robotics》拡散モデルがロボットの行動生成AIに ネット動画などを事前学習、動画生成で軌道抽出

                                                                  拡散モデルベースの動画生成AIを、ロボットの行動生成に応用しようとする技術がついに現れた。画像はタスク指示のテキストを基に実際に生成させたタスク動画例。(画像:グーグル・MIT・UCB・University of Alberta) 用いているのは「拡散モデル(diffusion model)」1)というディープラーニング技術ベースの生成モデルだ。Stable DiffusionやDALL・E 2など近年の画像生成AIの大半も、この拡散モデルという技術をベースにしている。 画像生成AIは従来、VAE(variational autoencoder)やGAN(generative adversarial network)などをベースに発展してきたが、2020年に拡散モデルで画期的な成果が出現して以来、急速に生成品質が向上した。ほとんど実写と見分けがつかないような画像を生成できるようになってきて

                                                                    《日経Robotics》拡散モデルがロボットの行動生成AIに ネット動画などを事前学習、動画生成で軌道抽出
                                                                  • Diffusion Model(拡散モデル)の追加学習をColabでやる方法|きざみみ(kizamimi)

                                                                    Diffusion Modelの追加学習を始める追加学習の有用性Dream BoothやHyper Networkなどの比較的軽量な追加手法でない純粋な追加学習は手軽さは下がる一方で、生成させたい画像へ導く能力において期待値が高いと予想しています。今回、実際の手法間の比較は行わず、追加学習の始め方を用意したColabベースのコードを使って説明します。 前提知識google colabの使い方が分かる google driveの使い方が分かる 追加学習までの流れ画像データセットを用意する データセットのキャプションを作成する―コード➀ 追加学習する―コード② 学習モデルを使って生成―コード③ データセットを用意するまず、高さ512ピクセル以上かつ幅512ピクセル以上の画像を沢山用意します。(私の場合は3000枚程度用意しましたが100枚程度でも動きます) 次に、用意したデータセットをCola

                                                                      Diffusion Model(拡散モデル)の追加学習をColabでやる方法|きざみみ(kizamimi)
                                                                    • はまなすなぎさ on Twitter: "昨年から爆発的な流行を見せているAI画像生成について、網羅的かつ多角的なメタサーベイを執筆しました。 核となる拡散モデルの基礎、一般層への浸透、浮き彫りとなった問題点、および加速度的に発展する手法群をまとめています。 多分どこ… https://t.co/4X015ytEF9"

                                                                      昨年から爆発的な流行を見せているAI画像生成について、網羅的かつ多角的なメタサーベイを執筆しました。 核となる拡散モデルの基礎、一般層への浸透、浮き彫りとなった問題点、および加速度的に発展する手法群をまとめています。 多分どこ… https://t.co/4X015ytEF9

                                                                        はまなすなぎさ on Twitter: "昨年から爆発的な流行を見せているAI画像生成について、網羅的かつ多角的なメタサーベイを執筆しました。 核となる拡散モデルの基礎、一般層への浸透、浮き彫りとなった問題点、および加速度的に発展する手法群をまとめています。 多分どこ… https://t.co/4X015ytEF9"
                                                                      • イラストAI推進派、マジで話の通じない人が多い 拡散モデルを使っている..

                                                                        イラストAI推進派、マジで話の通じない人が多い 拡散モデルを使っているからコラージュじゃないとは言い張るけど、なぜ拡散モデルを使えばコラージュにならないのかは一切説明できない ノイズ除去ネットワークに今まで学習した作品の要素が一切残ってないって断言できるの?マジで? そもそも『「入力を線形変換する処理単位」がネットワーク状に結合した数理モデル』であるニューラルネットワークが学習元の要素を一切持たないと証明することの方が困難だし無理筋でしょ JPGは不可逆な圧縮をした数字の羅列だから元の作品とは異なるので著作権は発生しないとか言うつもりなの? 結局ネットワークの蓋を開けてそれがどの程度の度合いなのか判断できない以上は断定できないよね? 現に現行AIでもi2iなしで学習元画像とほぼ一致する画像が生成される場合もあることは認められてるよね 学習は合法って言い張ってるのも「その他の当該著作物に表現

                                                                          イラストAI推進派、マジで話の通じない人が多い 拡散モデルを使っている..
                                                                        • 拡散モデルを使った文生成モデルについての紹介

                                                                          この記事はSansan Advent Calendar 2022の記事です。 はじめに こんにちは。fujisyo32です。入社してから1年が経過しました。いくつかのコンペに参加したり、国内の学会で発表したり、インターンのメンターを担当したりと色々あった一年でした。さて、今年は拡散モデルを使った画像生成モデルが広く共有されインターネット上で話題になっていました。拡散モデルのベースとなるアイデアはシンプルで、ノイズからスタートして徐々にノイズを除去していくことで画像を生成します。 https://arxiv.org/abs/2006.11239 話題になったのは文章をもとに画像を生成するモデルですが、このアイデアは他の生成モデルでも当然使えるはずです。そこで文生成もできるんじゃないかなと思っていたところ、すでに先行研究が複数あったので紹介します。 拡散モデルは画像などの連続値に適用することを

                                                                            拡散モデルを使った文生成モデルについての紹介
                                                                          • コロナウイルス拡散モデルの政策的含意:経済学者の観点と機会 - himaginary’s diary

                                                                            というNBER論文をマンキューとコーエンが称賛している。論文の原題は「Policy Implications of Models of the Spread of Coronavirus: Perspectives and Opportunities for Economists」で、著者はChristopher Avery(ハーバード大)、William Bossert(同)、Adam Clark(ヘルムホルツ環境研究センター*1)、Glenn Ellison(MIT)、Sara Fisher Ellison(同)。 論文では疫学モデルを以下のように経済学モデルになぞらえている。 There are two primary approaches for modeling the spread of disease: (1) “Mechanistic” and (2) “Phenomeno

                                                                              コロナウイルス拡散モデルの政策的含意:経済学者の観点と機会 - himaginary’s diary
                                                                            • 拡散モデルによる画像生成(CVIMチュートリアル)

                                                                              2023年5月開催の情報処理学会CVIM研究会において行ったチュートリアル講演の資料です。 拡散モデルによる画像生成について、「拡散モデルの原理と学習方法」「生成処理の制御(画像変換・編集への応用)」「生成処理の高速化(微分方程式との関係)」の3つに分けて解説しています。

                                                                                拡散モデルによる画像生成(CVIMチュートリアル)
                                                                              1

                                                                              新着記事