Denoising Diffusion Implicit Models Author: András Béres Date created: 2022/06/24 Last modified: 2022/06/24 Description: Generating images of flowers with denoising diffusion implicit models. View in Colab • GitHub source Introduction What are diffusion models? Recently, denoising diffusion models, including score-based generative models, gained popularity as a powerful class of generative models,
この記事は日経Robotics 有料購読者向けの過去記事ですが 『日経Robotics デジタル版(電子版)』のサービス開始を記念して、特別に誰でも閲覧できるようにしています。 深層生成モデルの1つである拡散モデル(Diffusion Model)の利用が急速に広がっている。2015年に米Stanford UniversityのSohl-Dickstein氏らによって最初のモデルが提案されてから1)しばらく注目されていなかったが、2020年に米University of California BerkeleyのJonathan Ho氏ら2)によってネットワークアーキテクチャや学習手法を工夫すれば他の深層生成モデルと同じ、もしくは上回る品質を達成できること、またデノイジングスコアマッチングなどとつながりがあることが示され(本コラム 2020年9月号も参照)、再注目された。 拡散モデルは生成品
OpenAIが先日発表したGLIDEにDiffusion Moldelが使用されているとのことで、最近話題のDiffusion Model(拡散モデル)について、まとめました。 サマリー 生成モデルとは Diffusion Model(拡散モデル)とは Forward diffusion process Reverse diffusion process 学習 応用例 画像生成 条件付き画像生成 画像変換 参考文献 サマリー ・Diffusion Model(拡散モデル)は、元データにノイズが徐々に付加されていき、最終的にガウシアンノイズとなるという前提を置き、その逆のプロセスをモデル化することでデータを生成する。 ・GANやVAEよりも高品質の画像を生成することに成功しており、様々な分野への応用が期待される。 生成モデルとは 生成モデルを使用することで、データ(ex. 画像)の生成プロセ
Amazon Web Services ブログ 機械学習モデルで推論時の頻出課題と、Amazon SageMaker を用いた解決方法について解説する動画を公開しました! 「ML Max!」 ということで、今週も機械学習の価値を最大化するための解説動画、ML Enablement Series (※)の、 Amazon SageMaker 推論 Part1 推論の頻出課題とSageMakerによる解決方法【ML-Dark-03】【AWS Black Belt】 を公開しました。 ※ ML Enablement Series とは、機械学習プロダクトにかかわる全ての人向けの機械学習の知識をお届けする Light パートと、機械学習のマネージドサービスを活用して MLOps を推進したいエンジニア向けの Dark パート から構成されており、週1回を目安に Light と Dark を交互に配
はじめに 2021年頃から「データ中心のAI」という新しいAI開発思想が提唱されるようになりました。この記事では、従来の「モデル中心のAI」の問題点を確認したうえでデータ中心のAIの概要と動向をまとめて、データ整備に関する具体的なノウハウを紹介します。 92%のAI実務家が遭遇した「データカスケード」問題 従来のAI研究開発において重視されてきたのは、AIシステムの中核となる(機械学習モデルのような)AIモデルでした。AI開発者はAIシステムの精度を目標値まで向上させるために、AIモデルに対してさまざまな技法を駆使するのが慣わしでした。 こうしたなか2021年5月、Googleの調査チームは今まで当たり前に考えられたきたAIモデル中心の開発思想を批判的に検討した論文『「誰もがデータではなくモデルについての仕事をしたがっている」:ハイステークスAIにおけるデータカスケード』を発表しました。同
Amazon Web Services ブログ Amazon SageMaker の NVIDIA Triton Inference Server を使用して高速でスケーラブルな AI をデプロイする 機械学習 (ML) とディープラーニング (DL) は、医療診断における画像分類、チャットボットにおける会話型 AI、e コマースにおけるレコメンデーションシステムに至るまで、さまざまなコンピューティングの問題を解決するための効果的なツールになりつつあります。ただし、特定のレイテンシーまたは高スループットの要件を持つ ML モデルは、一般的なコンピューティングインフラストラクチャで大規模に実行するには莫大なコストがかかる可能性があります。企業や顧客が期待する厳しいスループット、スケール、レイテンシーでの推論を最小限のコストで実行するために、ML モデルは GPU などの推論アクセラレータを必
はじめに 以下の書籍を参考にしながら,統計の基礎を学び直した軌跡,確率編1/3です. この記事は5部構成の2つ目になっています.以下も参照ください. 準備〜データ編・・・投稿済み 確率編1・・・この記事 確率編2・・・投稿済み 確率編3・・・まだ 推測編・・・まだ この記事を書いた動機,注意点,使用している技術,記事の構成,準備については準備〜データ編に掲載されています. これは主観でしかないのですが,エンジニアにも馴染みのある「データ」と比べて「確率」は扱われる機会が少なく,理解のハードルが高いかと思います.引き続き書籍を参考にしながら,理解を助けるために補足したり,独断で省略している部分もありますので,書籍に沿って進めたい方は書籍を購入ください! また,最初は「確率編」として3部構成を考えていたのですが,確率の基本部分を厚くしたため,以下のように確率編を3つに分けることにしました. 確
株式会社マイスタースタジオが国立情報学研究所を通じて研究者に提供しているデータセットです。 2022/08/18 作成 データ概要 商品・サービス口コミデータ 株式会社マイスタースタジオが運営する多様な商品・サービスの口コミサイト「みんなの評判ランキング」への投稿データです。 2017年1月16日から2022年7月12日までに投稿された,約4,700の商品・サービスに対する約16万件の口コミデータで,個人情報は含まれていません。具体的なデータ項目は下記の通りです。 商品・サービスデータ:商品ID/商品名/カテゴリ名/サブ評価項目 口コミデータ:口コミID/投稿者名(ニックネーム)/会員登録の有無/投稿日時/商品ID/商品名/口コミタイトル/口コミ本文/評価(満足度)/サブ評価/紐づくタグ数/参考になったボタンクリック数/気持ちアイコンID データはCSV形式で,サイズは約145MBです。
株式会社マイスタースタジオ(マイスタースタジオ、大阪府大阪市、代表取締役社長:妹尾せのお 優ゆう)と情報・システム研究機構 国立情報学研究所(NIIエヌアイアイ、東京都千代田区、所長:喜連川きつれがわ 優まさる)は学術研究分野でのデータ活用促進に向けて提携し、マイスタースタジオが運営する商品・サービスの口コミサイト「みん評」の口コミデータを研究用データセットとして8月18日(木)より無償提供を開始しました。 この「みんなの評判口コミデータセット」は、NIIのデータセット共同利用研究開発センター(センター長:コンテンツ科学研究系教授 大山 敬三)が運営する情報学研究データリポジトリ(IDR)を通じて提供されます。 マイスタースタジオが運営する「みん評」(https://minhyo.jp/)は、多様な商品・サービスを取り上げ、実際にそれらを利用した消費者から口コミを収集しているサイトです。現
口コミのジャンルは「引越し」「保険」「旅行」「美容」「資格」など暮らしに密接したものを用意。NIIは「肯定的・否定的コメントのいずれも、具体性や根拠をもった口コミを収載していることを特徴としている」とし、自然言語処理分野などでの利用を想定する他、主観的な評価スコアと組み合わせた分析も可能としている。 NIIでは2015年4月にデータセット共同利用研究開発センターを設置。データサイエンス研究のため、さまざまな民間企業や研究機関が持つ各種データセットを受け入れ、研究者に提供する「情報学研究データリポジトリ」事業に取り組んできたという。今回の取り組みもその一環に当たる。 関連記事 「ディープフェイク」を見破るプログラム、NIIが開発 圧縮された映像でも一定の信頼性 国立情報学研究所が、ディープフェイクを見破るプログラムを開発した。WebAPIとして提供するため、同プログラムを組み込んだWebサー
筑波大学発AIスタートアップのAIdeaLab(東京都千代田区)は8月17日、5つの文字から1万4000以上の文字をAIで自動生成するフォント生成システムの特許を出願したと発表した。 システムは、敵対生成ネットワーク(GAN)をベースに、大量のフォントを学習させた上で、手作業でデザインした数個の文字から、太さやセリフ(装飾)の形状を抽出し、生成する。パラメーターの値を調整することで、新しいフォントとして出力することも可能。ピクセル画像ではなく、ベクター画像として生成する独自技術により、フォントファイルとしての出力を可能にしたという。 特許は、フォント生成モデルだけでなく、アプリケーションUIも含む。パラメーター調整でフォントを生成するUI、少ない文字数でのアップロードでフォントを生成するUIなど、さまざまなパターンのサービス展開を織り込んでおり、特許出願技術をベースに、フォント制作会社向け
米Alphabet傘下のGoogleの研究部門Google ResearchとEveryday Robotsは8月16日(現地時間)、高度な言語モデルとロボット学習によって「モラベックのパラドックス」を解決するための共同研究「PaLM-SayCan」を発表した。 Everyday RobotsがGoogleのキャンパスで稼働させているヘルパーロボットで実行する学習モデルにPaLM(Pathways Language Model)を採用することで、ロボットの性能を強化し、より複雑で抽象的なタスクを実行させるための研究だ。 モラベックのパラドックスとは、AIやロボット工学では、高度な知性に基づく推論よりも人間の本能に基づく運動スキルや知覚を覚えさせることの方が困難だという説だ。 Everyday Robotsのロボットたちは、「ペットボトルの水を持ってきて」というような単純な命令は理解し、実行
【2020年5月28日発表資料の差し替え】IPAのWebサイトで企業・団体等から寄せられた自己診断結果の分析レポートが公表されました。 【2019年10月25日発表資料の差し替え】ベンチマーク策定の中立組織としてIPAが選定され、IPAのWebサイトで自己診断結果について提出可能となりました。 経済産業省は、我が国企業におけるデジタル経営改革を推進するため、『「DX推進指標」とそのガイダンス』を取りまとめました。本指標は、各企業が簡易な自己診断を行うことを可能とするものであり、経営幹部や事業部門、DX部門、IT部門などの関係者の間で現状や課題に対する認識を共有し、次のアクションにつなげる気付きの機会を提供することを目的とします。 また、取締役会での議論の活性化に資する観点から、コーポレートガバナンス・コードにおいて実施が求められる取締役会の実効性評価にも活用できるものとして、『DX推進にお
IPAは、経済産業省が作成した「DX推進指標」を用いて各企業が自己診断した結果を収集し、2021年までのデータを分析した結果を分析レポートとしてまとめました。 分析レポートでは、自己診断結果を提出した企業486社の全体的な傾向を分析するとともに、企業規模別及び中小企業の特徴に加え、先行企業とDX認定制度で認定された企業の特徴の分析をさらに、2019年から2021年までの経年変化についても分析を行っております。 [先行企業:現在値の平均が3以上の企業] 分析レポートの構成は以下の通りです。分析結果から得られた示唆や仮説は、「DX推進指標 自己診断結果 分析レポート(2021年版)概要版」にも記載しておりますので、ぜひご一読ください。 【分析レポートの構成】 はじめに 分析の対象と手法 分析結果(2021年) 分析結果(経年変化) まとめ なお、DX推進指標の項目の詳細及び、自己診断結果のご提
日本ディープラーニング協会(JDLA)主催「合格者の会 2022」にて、 JDLA理事長 松尾 豊 東京大学大学院教授がG検定・E資格の合格者に向けて特別講義を行いました。 松尾教授による特別講義「DLの進展と未来」の様子をお届け。今年3月、岸田首相や経済産業大臣等が参加した第4回「新しい資本主義実現会議」で実際に発表したプレゼンテーションを振り返ります。 AIが新しい資本主義の柱に はじめに、松尾教授は今年3月に開催され、岸田首相や萩生田経済産業大臣らが参加した新しい資本主義実現会議でのプレゼンテーションを振り返りました。新しい資本主義の論点は次の4つです。 成長と分配 人への投資 スタートアップ 科学技術に関しては、人工知能と量子 新しい資本主義の論点を踏まえて、アルファ碁や画像認識技術だけでなく、GPT-3(自然言語モデル)などの基盤モデル(Foundation Models)やAl
情報処理推進機構(IPA)は2022年8月17日、「DX推進指標 自己診断結果 分析レポート(2021年版)」を公開した。これは、経済産業省が作成したDX(デジタルトランスフォーメーション)推進状況の自己診断ツール「DX推進指標」に基づいて各企業が提出した自己診断結果をまとめたもの。 なお、DX推進指標とは、DXを実現する上で基盤となるITシステムの構築について、35項目の定性指標を設けて成熟度を0~5の6段階で評価したもの。レベル0は「DX未着手」、レベル5は「デジタル企業として、グローバル競争を勝ち抜くことのできるレベル」だ。 「レベル3未満の企業」が8割 IPAは、35項目の成熟度の平均値が3以上の企業を「先行企業」と定義。レポートによると、先行企業の割合は2021年が17.7%で、2020年の8.5%から倍増した。一方で、全社戦略に基づいて部門横断的にDXを推進できるレベルに達して
この数週間ほど、人間が与えた文章に基づいて画像を生成するAI(人工知能)のサービス「Midjourney(ミッドジャーニー)」が話題だ。同種のAIとしては米OpenAI(オープンAI)のDALL-Eや米Google(グーグル)のImagenなどが先行していたが、一般ユーザーはなかなか試せなかった。それに対してMidjourneyは、誰でも画像生成を試せるのが魅力だ。 Midjourneyは写真や絵画などの説明文(キャプション)を与えると、それに基づいたイラストを生成するAIサービスである。例えば筆者が「本を読む犬」という文章を与えたところ、Midjourneyは書籍のページを開いた犬のイラストを生成してくれた。 このコラムではGAFA各社のAI開発の最新動向を多数取り上げてきたが、論文段階の最新技術についてはその能力を実際に体験してみることはできなかった。画像生成AIはその際たるもので、グ
緑に浸食される廃墟――SFアニメの舞台のような世界観を描いたのは、AI(=人工知能)だ。制作に使われたのは「Midjourney」という画像生成AIで、驚くほどクオリティの高い絵が誰でも簡単に作れてしまうと話題になっている。 【映像】ネットに投稿された絵の数々 Twitterに作品を投稿した852話さんは「神絵が1分で生成される 参った」とコメント。インターネット上にある大量の絵や画像をディープラーニングしたAIは、浮世絵風のものから人物の絵など、画風や対象を自由自在に表現できる。自分で生成を指示して、できあがった絵をSNSに投稿する人が相次いでいる。 絵を描けない人からすると“とんでもない神ツール”だが、AIによる作品作りをプロはどう見ているのだろうか。自らもMidjourneyで絵を作ってみたというヨーロッパ在住の現代アーティスト・萩野真輝さんに話を聞いた。 「一般公開をされていること
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く