並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 169件

新着順 人気順

GaNの検索結果41 - 80 件 / 169件

  • DeNA目線で見る 音声変換の最先端 - Qiita

    (2021年5月13日追記)七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。 私は今まで音声合成や距離学習の研究をしてきて、音声変換(voice conversion;VC)については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。 想定する読者は、音声変換に興味を持つ方、音声技術を生かして新たなエンタメ作りに挑戦したい方です。特に、 音声変換に関心がある学生がサクッと論文レベルで最先端の音声変換を把握できるようなお得な記事で 読者の「音声変換による新しいエンタメ作りに向けた研究開発の一歩」になる ように努めます。

      DeNA目線で見る 音声変換の最先端 - Qiita
    • AI画像生成とワールド制作|るら

      自宅用に使えるワールドをBoothで販売してたりします。 ワールド制作の役に立つかなー、と思ってAI画像生成に手を出してみた、という次第です。 DALL·E 以前からAI画像生成自体、ワールド制作の何かに使えそうだなー、とうっすら考えていたところ、DALL·EというAI画像生成のサービスの噂を聞き、Waitlistに並んで3ヶ月ほどが経ちました。 そして先日、ついにアクセス権を手に入れた…!! とりあえず試してみると… え……すご…(言葉を失う)いや、なにこれ、すご… もうなんにでも使えるじゃん。 よっし、いろいろ試すぞー!!! …となっていたところだったのですが、ベータテストと方針が変わり、無料体験分を使い切ると15$で115回分のチケットを購入する、という方式になっているようでした。 まー、そりゃそうだよねー。サーバー負荷とかすごそうだし… 凄い画像を生成できるならそれでも安いかー で

        AI画像生成とワールド制作|るら
      • https://jp.techcrunch.com/2020/11/18/2020-11-17-google-has-created-an-ai-powered-nightmare-creature-generator/

          https://jp.techcrunch.com/2020/11/18/2020-11-17-google-has-created-an-ai-powered-nightmare-creature-generator/
        • ディズニー顔に瞬時に変換するAI!ウワサの「Toonify」論文を解説! - Qiita

          オミータです。ツイッターで人工知能のことや他媒体の記事など を紹介していますので、人工知能のことをもっと知りたい方などは @omiita_atiimoをご覧ください! 他にも次のような記事を書いていますので興味があればぜひ! 「募ってはいるが、募集はしていない」 人たちへ GANにもオーギュメンテーションは超有効だった!DAだけでSoTA達成した最新論文を解説! GANへの新しい正則化「ICR」が期待大な件&解説 U-Netを識別器に!新たなGAN「U-NetGAN」を解説! 画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! 「Toonify Yourself!」というWebサイトをご存知でしょうか。顔の画像をアップロードすると瞬時にディズニー顔に変換してくれるというもので、Twitterなどで話題になっていたのをご覧になった方も多く居るかと思います。

            ディズニー顔に瞬時に変換するAI!ウワサの「Toonify」論文を解説! - Qiita
          • 「誰がモデルか、なんとなく分かる」アニメ風の顔画像に変換するAI、台湾の研究チームが開発

            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 国立台湾科技大学の研究チームが開発した「Cartoon Style Transfer in Faces using GANs」は、現実の顔のアイデンティティーを維持したままアニメ風の顔画像に変換するGAN(Generative Adversarial Network)を使った手法だ。実写感を排除しているのに、元の顔の原型をできるだけ残した点が特徴だ。 先行研究でも実写の顔画像からアニメ風の顔画像にスタイル変換するGANを使ったモデルが多数報告されている。TikTokやSnapchatなどの多くのモバイルアプリでも顔をアニメ化できるカートゥーン・フィルター機能を提供している。 これらの問題点

              「誰がモデルか、なんとなく分かる」アニメ風の顔画像に変換するAI、台湾の研究チームが開発
            • 適当なスケッチをAIで実写風に変換するツール。GeForce RTX対応で無料

                適当なスケッチをAIで実写風に変換するツール。GeForce RTX対応で無料
              • ベクトル埋め込みの最適化によるアイデンティティを保ったキャラクター生成 Preferred Networks Research & Development

                本記事は、2022年夏季インターンシッププログラムで勤務された早川知志さんによる寄稿です。 はじめまして。2022年度のPFN夏季インターンに参加した早川知志です。普段はオックスフォード大学で数学(確率論・数値解析)の博士学生をしており、確率測度の離散化やそれにまつわる理論や応用に興味があります。 今回は、大学でやっていることとは趣旨を変えて、深層学習のエンターテインメント応用として二次元キャラクターの学習・生成タスクに取り組みました。 学んだキャラクターのCLIP embeddingを用いた生成例 1. Motivation オリジナルのキャラクターを描くときに角度や表情を微調整するのには途轍もない労力が必要です。筆者はイギリスでのロックダウン以来趣味でイラストや漫画を描こうとすることが増えたのですが、その過程でこのことに気付きました。生成モデルの力を借りて今までに描いたことのない構図で

                  ベクトル埋め込みの最適化によるアイデンティティを保ったキャラクター生成 Preferred Networks Research & Development
                • 2022年版・深層学習による写実的画像合成の最新動向

                  2022/9/14 GPU UNITE 2022 / Day3:CG研究 セッション (https://gdep-sol.co.jp/gpu-event/gpu-unite-2022/day3/) 講演資料

                    2022年版・深層学習による写実的画像合成の最新動向
                  • 【ICLR2020採択論文】GANのなめらかさと安定性 - Preferred Networks Research & Development

                    リサーチャーの南です。機械学習のトップ会議のひとつであるICLR2020に、2019年度PFN夏季インターンのCasey Chuさん、PFN技術顧問の福水健次教授と共同で書いた論文が採択されました。 Casey Chu, Kentaro Minami and Kenji Fukumizu. Smoothness and Stability in GANs. In International Conference on Learning Representations (ICLR), 2020, to appear. 論文リンク 本記事では、上記論文の内容を簡単に紹介します。 背景: GANと安定化技術 周知のとおり、敵対的生成ネットワーク (GAN, [1]) はとても強力な生成モデルです。例えば、GANによって自然な高解像度画像を生成できることが知られています。下記は高解像度画像生成にお

                      【ICLR2020採択論文】GANのなめらかさと安定性 - Preferred Networks Research & Development
                    • 赤ちゃんの顔をAIで予測 両親の顔写真をアップロードするだけで

                      画像素材サイトを運営するACワークスは3月15日、両親の顔写真から赤ちゃんの顔をAIで予測するサービス「赤ちゃんAC」を公開した。無料で利用できる。 2人の顔写真を同サイトへアップロードすると、2人から生まれる赤ちゃんの顔画像をAIで合成する。合成画像は無料でダウンロード可能で、アップロードした顔写真も24時間で完全に消去するとしている。 赤ちゃんの顔画像の合成には、2人の顔を組み合わせて高解像な合成画像を作るディープラーニング技術の一つである、米NVIDIAの「StyleGAN」を利用しているという。親の顔の特徴抽出には「pixel2Style2pixel」というStyleGAN向けの計算手法を使うことで、通常は1分ほどかかるエンコード処理を数秒にまで短縮したとしている。 関連記事 “実在しないリアルな顔”を自在に編集できる「StyleRig」 StyleGANで生成した顔の向き、表情、

                        赤ちゃんの顔をAIで予測 両親の顔写真をアップロードするだけで
                      • ぼやけた顔写真から最大64倍鮮明な画像を生成するAIツールを開発、デューク大研究チーム

                        デューク大学の研究チームは、ぼやけて被写体が特定できない顔写真から、これまでの方法よりも精細な、極めて本物に近い画像をコンピュータで生成できるAIツール「PULSE」(Photo Upsampling via Latent Space Exploration)を開発した。 研究チームは、2020年6月14~19日の会期でオンラインで開催中の2020 Conference on Computer Vision and Pattern Recognition(CVPR)で、PULSEのプレゼンテーションを行った。 これまでの方法では、顔写真の解像度は最大8倍にしか高めることができなかった。デューク大学のチームは少数のピクセルからなる顔写真画像の解像度を最大64倍に高める方法を考案した。 研究チームを率いたデューク大学のコンピュータ科学者シンシア・ルーディン氏は「このような低解像度の画像を用いて

                          ぼやけた顔写真から最大64倍鮮明な画像を生成するAIツールを開発、デューク大研究チーム
                        • https://jp.techcrunch.com/2021/03/11/preferred-networks-crypko/

                            https://jp.techcrunch.com/2021/03/11/preferred-networks-crypko/
                          • AnimeGANv2 - a Hugging Face Space by akhaliq

                            Discover amazing ML apps made by the community

                              AnimeGANv2 - a Hugging Face Space by akhaliq
                            • 手書きスケッチからリアル顔画像を作成、深層学習で「DeepFaceDrawing」

                              手書きスケッチからリアル顔画像を作成、深層学習で「DeepFaceDrawing」 2020-06-04 中国科学院と香港城市大学による研究チームが開発した「DeepFaceDrawing」は、手書きスケッチからリアルな顔画像を生成する深層学習フレームワークだ。 手書きスケッチからリアル顔を生成するDeepFaceDrawing このような深層学習を用いたスケッチ画像からリアル画像への変換では、Image-to-Image Translation with Conditional Adversarial Nets [Isola et al. 2017] などで実証されている。しかしデータ駆動型の性質上、実画像とそれに対応するエッジマップのペアからネットワークを学習することが多いため、リアルな顔画像を合成するためには、実画像のエッジマップに近い品質のテストスケッチが必要となる。それを用意する

                                手書きスケッチからリアル顔画像を作成、深層学習で「DeepFaceDrawing」
                              • PyTorchでDCGANを作ってみよう

                                そこで、今回は「CNNなんて怖くない! その基本を見てみよう」や「PyTorchで畳み込みオートエンコーダーを作ってみよう」などで取り上げた畳み込みニューラルネットワークを利用して、GANを構築してみることにします。 実際の構成は、次のようになります。以下ではConv2dクラスとConvTranspose2dクラスのみを含めてありますが、BatchNorm2dクラスおよびtorch.nnモジュールが提供する活性化関数クラス(torch.nn.Sigmoidクラス、torch.nn.Tanhクラス)も使用します。訓練データと偽物のデータの識別と偽物データの生成の中心的な処理はこれら2つのクラスが請け負うということです。 識別器(ディスクリミネーター)では、CNNで使用するConv2dクラスにより訓練データおよび生成器(ジェネレーター)から入力されたデータを最終的に0~1の値へと変換していきま

                                  PyTorchでDCGANを作ってみよう
                                • GitHub - xinntao/Real-ESRGAN: Real-ESRGAN aims at developing Practical Algorithms for General Image/Video Restoration.

                                  🔥 AnimeVideo-v3 model (动漫视频小模型). Please see [anime video models] and [comparisons] 🔥 RealESRGAN_x4plus_anime_6B for anime images (动漫插图模型). Please see [anime_model] 💥 Update online Replicate demo: Online Colab demo for Real-ESRGAN: | Online Colab demo for for Real-ESRGAN (anime videos): Portable Windows / Linux / MacOS executable files for Intel/AMD/Nvidia GPU. You can find more information here

                                    GitHub - xinntao/Real-ESRGAN: Real-ESRGAN aims at developing Practical Algorithms for General Image/Video Restoration.
                                  • 量子GAN入門 - Qiita

                                    はじめに 去年から量子コンピュータの勉強会に参加するようになったのですが、そこでとりあげられていた量子GANのお話が難しいながらもとても面白かったので、論文を読んでまとめることにしました。 また、量子GAN実装の方法も書いてあったので、MDR社のblueqatとpytorchでコードを書いてみることにしました。 論文のリンク↓↓ https://arxiv.org/pdf/1807.01235.pdf 論文の要旨 GANはDiscriminatorとGeneratorを交互に競合させながら学習を進めることで、本物に近いデータの生成を可能にするネットワークです。本論文ではDiscriminatorはそのままにして、Generatorを量子ゲートでおきかえています。これにより既存のGANや、量子機械学習と比べていくつかの点で有用だそうです。 古典的なGANでは勾配消失問題により、離散的な値を生

                                      量子GAN入門 - Qiita
                                    • StyleGANを遊び尽くせ!! ~追加学習不要の画像編集~ - Qiita

                                      はじめに AdventCalender論文24日目担当のぱしふぃんです。 突然ですが,最近このような論文1が出ました。 テスト https://t.co/QoXamqHB9w — ぱしふぃん (@pacifinapacific) December 21, 2019 なんとただの1枚絵をVtuberのモデルにできちゃうのです。ニコニコに上がっている解説動画では賞賛のコメントが多数寄せられていました。 これはすごい!ということで私も読んだのですが、データセットを作る段階ですごい労力を費やしているようでした。3dモデル1つ1つを目を閉じたり、開けたり、顔を傾けたりと差分をとり、ラベル付けしていくのはとても大変です。 「そんなラベル付けの手間を失くして似たようなことがやりたい!!」 その一つの可能性として今回StyleGANに着目してみます。StyleGANは滅茶苦茶綺麗な画像を生成できるモデルで

                                        StyleGANを遊び尽くせ!! ~追加学習不要の画像編集~ - Qiita
                                      • Engadget | Technology News & Reviews

                                        OpenAI co-founder and Chief Scientist Ilya Sutskever is leaving the company

                                          Engadget | Technology News & Reviews
                                        • GANの概要とDCGANのアーキテクチャ/アルゴリズム

                                          社内で使った深層学習勉強会スライド(再構成版) 2019/10/30@Hirosaji ===== Title (English): GAN overview and DCGAN architecture / algorithmRead less

                                            GANの概要とDCGANのアーキテクチャ/アルゴリズム
                                          • メルアイコン生成器を作った話 - Qiita

                                            はじめに このアイコンをご存知でしょうか。 かの有名なMelvilleさんのアイコンです。 Melvilleさんに好きなキャラなどを描いてもらい、それをtwitterのサムネにしている人が大勢いることで知られ大きな支持を得ています。 この方の描くアイコンはその特有の作風から、「メルアイコン」などとよく呼ばれています。 代表的なメルアイコンの例 (それぞれゆかたゆさんとしゅんさんのものです (2020/2/19現在)) 自分もこんな感じのアイコンが欲しい!!!!!!ということで機械学習でメルアイコン生成器を作りました。 本記事ではそれに用いた手法をおおざっぱに紹介していきたいと思います。 GANとは 生成にあたってはGAN(Generative adversarial networks、敵対的生成ネットワーク)という手法を用いています。 図の引用元 この手法では画像を生成するニューラルネット

                                              メルアイコン生成器を作った話 - Qiita
                                            • AIで実在しないモデル画像を生成 広告効果に応じて容姿を変化 CAが新サービス

                                              サイバーエージェント(CA)は10月28日、AIで実在しないモデルの画像を生成し、広告効果に応じてモデルの容姿や背景などを変えるサービス「極予測AI人間」を11月から提供すると発表した。AIによって企業やブランドのイメージに適したモデルを生成し、広告効果に応じて表情や髪形などを変えることで、効果をさらに高めるという。 モデルの画像生成には、画像を生成するAIと画像を評価するAIを敵対させ、精度を向上させる技術「GAN」(敵対的生成ネットワーク)を利用。実在するモデルの画像を学習することで、架空のモデル画像を生成する。企業やブランドが想定するターゲットごとに、モデルの髪形、ポーズ、ファッション、背景を変えたり、外国籍のモデル画像を生成したりできるという。 広告の展開後、広告のクリック数や広告経由の資料請求数、広告のPV数などをAIに学習させ、髪形やファッションなどをアップデート。企業やブラン

                                                AIで実在しないモデル画像を生成 広告効果に応じて容姿を変化 CAが新サービス
                                              • AIで「実在しない男性モデルの画像」を生成 「INAI MODEL」がラインアップ拡充

                                                ストックフォトサービスを手掛けるイメージナビ(札幌市)は6月1日、AIを活用して実在しないモデルの画像を作成するサービス「INAI MODEL」に、男性モデルを追加した。これまで女性の画像のみ提供していたが、AIのアップデートを重ね、男性の場合でもクオリティーを維持できると判断したことから販売を決めたという。従来と同じく、Web広告やポスターなどでの利用を見込む。 INAI MODELでは、実在する人物の写真を利用許諾を得た上で撮影。AIで顔部分を加工して架空のモデル画像を生成する。開発にはAIベンチャーのデータグリッド(京都市)が協力。画像を生成するAIと画像がAIによるものか評価するAIを戦わせることで精度を向上させる技術「GAN」(敵対的生成ネットワーク)を活用している。 モデルが実在しないため、一度購入すれば契約期間を気にせず永久に画像を使える他、モデルがスキャンダルを起こすリスク

                                                  AIで「実在しない男性モデルの画像」を生成 「INAI MODEL」がラインアップ拡充
                                                • 他人の化粧を自分に転写できるバーチャルメイク技術「PSGAN」 動画にも対応

                                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 北京航空航天大学、中国科学院、シンガポール国立大学、シンガポールYITU Technologyによる研究チームが開発した 「PSGAN」は、画像に写る人の顔の化粧を別の画像内の顔へ転写する、深層学習を用いた手法だ。表情やポーズがそれぞれ違っても化粧だけを転写できる。 これまでもメイクアップを異なる画像で転写する研究は行われており成果も出ていたが、ポーズや表情の違いが大きい画像間では依然として困難で、顔の向きが常に変化する動画への転移はさらに難しかった。さらに化粧の濃淡を制御できるようなカスタマイズはできず、転移する部分は指定できないなど、応用範囲は限られていた。 これらの問題を解決するため

                                                    他人の化粧を自分に転写できるバーチャルメイク技術「PSGAN」 動画にも対応
                                                  • 画像生成AIはアートのあり方を変えてしまうのか?

                                                    ベクトル量子化(VQ)を用いたVAEである「VQ-VAE」を、敵対的生成ネットワーク(GAN)に発展させた新しい画像生成モデルが「VQGAN」です。このVQGANと、テキストと画像という異なるデータを結びつけるニューラルネットワークの「CLIP」を組み合わせることで、「入力したテキストから画像を生成するモデル」をライアン・モールトンさんが作成しています。 Tour of the Sacred Library – Ryan Moulton's Articles https://moultano.wordpress.com/2021/07/20/tour-of-the-sacred-library/ モールトンさんは、画像生成モデルの「VQGAN」と、画像とテキストを結びつけるニューラルネットワークの「CLIP」を組み合わせ、「入力したテキストから画像を生成するモデル」を作成しました。 このモ

                                                      画像生成AIはアートのあり方を変えてしまうのか?
                                                    • 軽量画像変換AIモデル「FacialCartoonization」で簡単に顔をアニメ化する方法 - karaage. [からあげ]

                                                      素材提供: 変デジ研究所ロンスタさん 顔を手軽にアニメ化 久しぶりのディープラーニングネタです。顔を手軽にアニメ化できるAIモデルがありました。 GitHub - SystemErrorWang/FacialCartoonization: Imporved performance on facial image cartoonizaiton GANと呼ばれる技術をベースにしたもので、同じようなAIモデルは結構あるのですが、このリポジトリ(ソフト)が優れているのは、モデルが4.7MBと軽量なことです。 折角なので、誰でも簡単に顔をアニメ化できるように、Google ColabratoryのNotebookを作って見ました。 FacialCartoonization Google Colab Notebook Google Colabratoryがわからないという方は、以下ブログ記事を参照くだ

                                                        軽量画像変換AIモデル「FacialCartoonization」で簡単に顔をアニメ化する方法 - karaage. [からあげ]
                                                      • GPU1枚、1日未満で学習!超高速学習GAN、「Lightweight GAN」

                                                        3つの要点 ✔️ Skip-Layer Excitationとself-supervised Discriminatorを提案し、パラメータの大幅削減に成功 ✔️ 少量データでも学習可能 ✔️ 1024×1024の画像もGPU1枚、数時間で学習可能 Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image Synthesis written by Anonymous (Submitted on 29 Sep 2020) Comments: Accepted at ICLR2021 Subjects: Computer Vision and Pattern Recognition (cs.CV); Image and Video Processing (eess.IV) Comm 概要 これまでのG

                                                          GPU1枚、1日未満で学習!超高速学習GAN、「Lightweight GAN」
                                                        • Imagen: Text-to-Image Diffusion Models

                                                          Imagen unprecedented photorealism × deep level of language understanding unprecedented photorealism deep level of language understanding We present Imagen, a text-to-image diffusion model with an unprecedented degree of photorealism and a deep level of language understanding. Imagen builds on the power of large transformer language models in understanding text and hinges on the strength of diffusi

                                                          • 【StyleGAN入門】「ある男性の生涯」で遊んでみた♬ - Qiita

                                                            はっきり言ってExampleを利用するだけで、よく流れている動画(男性⇒女性とかの変換)はすぐ再現出来、やってみるとほんとに凄い。 今回は、その一番の入り口だけやってみての紹介記事です。 参考は以下のとおりです。 【参考】 ①StyleGANを使ってみた ②StyleGanで福沢諭吉を混ぜてみる ③Puzer/stylegan-encoder ④NVlabs/stylegan 現在、styleGAN2も出ているようですが、まずはStyleGANの最初の一歩をやってみて、実感を持ちたいと思います。 その結果、ほぼ1日で以下の動画が作成できたので、気になったところを記事にしておきます。 ※老人~幼児~老人に変化するものも作成しましたが、$512^2$でも10MB超えてしまいました やったこと ・環境 ・pretrained_example.pyを動かす ・潜在空間を動かす ・Gifアニメーショ

                                                              【StyleGAN入門】「ある男性の生涯」で遊んでみた♬ - Qiita
                                                            • GitHub - TachibanaYoshino/AnimeGAN: A Tensorflow implementation of AnimeGAN for fast photo animation ! This is the Open source of the paper 「AnimeGAN: a novel lightweight GAN for photo animation」, which uses the GAN framwork to transform real-world photos

                                                              Photos Videos Added the AnimeGAN Colab. AnimeGANv3 has been released. AnimeGANv2, the improved version of AnimeGAN. Online access: Be grateful to @TonyLianLong for developing an online access project, you can implement photo animation through a browser without installing anything, click here to have a try. Pytorch version: pytorch-animeGAN. Be grateful to @ptran1203. Some suggestions: since the re

                                                                GitHub - TachibanaYoshino/AnimeGAN: A Tensorflow implementation of AnimeGAN for fast photo animation ! This is the Open source of the paper 「AnimeGAN: a novel lightweight GAN for photo animation」, which uses the GAN framwork to transform real-world photos
                                                              • 耳から顔を深層学習で生成 生体認証にも有用? 独研究

                                                                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 独カールスルーエ工科大学とトルコのイスタンブール工科大学による研究チームが開発した「Ear2Face」は、 耳の画像から正面の顔画像を生成する深層学習を用いた手法だ。生体認証の識別部位として耳を活用する。 耳も顔も個人の生体形質であり、遺伝子型に基づいて生成されることから、耳と顔の間には遺伝的による暗黙の関係があると仮定して開発されたのが今回の手法だ。 この仮定を踏まえて、被験者の耳の画像から正面から見た顔の画像を生成するための深層学習ネットワークを設計する。ネットワークは、耳から生成した顔画像と元の顔画像を真偽判定しながら学習するGAN(Generative Adversarial Ne

                                                                  耳から顔を深層学習で生成 生体認証にも有用? 独研究
                                                                • Inpaintingからディープラーニング、最新のGAN事情について学べる本を書いた - Qiita

                                                                  3~4ヶ月かけてA4・195ページの薄くない薄い本を書きました。タイトルは『モザイク除去から学ぶ 最先端のディープラーニング』です。TensorFlow2.0全対応です。 Inpaintingとは 画像の一部を塗りつぶしてもっともらしく画像を復元するタスク。画像全体ではなく、白く塗りつぶした部分の生成を目標とします。 画像:https://github.com/JiahuiYu/generative_inpaintingより 関連: * GLCICで無かったことにしたいアレコレ(GANを使った画像生成を Globally and Locally Consistent Image Completion で理解してみる) * 【論文読み】Image Inpainting for Irregular Holes Using Partial Convolutions ※Inpaintingという言

                                                                    Inpaintingからディープラーニング、最新のGAN事情について学べる本を書いた - Qiita
                                                                  • 深層生成モデルによるメディア生成

                                                                    【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)

                                                                      深層生成モデルによるメディア生成
                                                                    • 最新GaNチップでUGREEN史上最小となったUSB充電器

                                                                        最新GaNチップでUGREEN史上最小となったUSB充電器
                                                                      • AIによって生成された人間の画像は「瞳孔の形」で区別できる

                                                                        近年AIを用いた画像生成技術が飛躍的な進歩を遂げており、実在しない人物の顔写真がSNSなどで大きな問題を引き起こしています。こうした状況の中、アメリカの研究チームが現行のニューラルネットワークで生成された人間の画像は「瞳孔の形」で区別できるという研究結果を発表しました。 [2109.00162] Eyes Tell All: Irregular Pupil Shapes Reveal GAN-generated Faces https://arxiv.org/abs/2109.00162 近年は敵対的生成ネットワーク(GAN)と呼ばれる人工知能アルゴリズムの発展によって、実在しない人物の顔写真を簡単に作成できるようになった結果、AI生成された顔写真をプロフィールに用いるボットアカウントが急増。こうしたボットアカウントは詐欺などに用いられているため、大きな社会問題となっています。 存在しない

                                                                          AIによって生成された人間の画像は「瞳孔の形」で区別できる
                                                                        • PFN、キャラ生成PF「Crypko」のウェブサービスを開始--顔や上半身イラストを自動生成

                                                                          Preferred Networksは4月26日、顔ならびに上半身のイラストが自動生成・編集できるキャラクター生成プラットフォーム「Crypko」(クリプコ)を、同日からウェブサービスとして提供を開始した。 Crypkoは、深層学習を応用した画像生成モデルの1つである「敵対的生成ネットワーク」(generative adversarial networks、GAN)を使った顔のイラスト生成モデルとして、2018年に開発を開始。6世代目となる今回の生成モデルでは、顔だけでなく人間のイラストレーターが描画したようなキャラクターの上半身のイラストを生成することが可能となっている。 さらに、生成したキャラクターを融合することにより、それらの特徴を継承した新しいキャラクターを生成する。髪や目の色、表情などの属性をユーザーの好みで変更することも可能となっている。ユーザーは、所定のアプリ内ポイント(Cr

                                                                            PFN、キャラ生成PF「Crypko」のウェブサービスを開始--顔や上半身イラストを自動生成
                                                                          • SushiGAN2 〜この寿司は実在しません〜 - Qiita

                                                                            はじめに 2年ほど前,私はGANというものに出会って感銘を受け,Qiitaで『SushiGAN 〜人工知能は寿司を握れるか?〜』というちょっと釣りっぽいタイトルの記事を書きました.中身はChainerのexampleにあったDCGANの実装を寿司の画像で学習させてみるというもので,下のようなモード崩壊気味の寿司画像を作って満足していました. あれから2年あまりが経ち,画像生成の技術は驚くべき発展を遂げました1.StyleGAN,そしてStyleGAN2が登場し,すぐには見分けがつかないほどの品質で1024x1024の人の顔の画像が生成できるようになりました [1].そのインパクトは凄まじく,"This Person Does Not Exist"を皮切りに,GANで生成したリアルな偽物のサンプルをランダムに表示するWebサイトがちょっとした流行になりました.いくつか例を挙げると,次のような

                                                                              SushiGAN2 〜この寿司は実在しません〜 - Qiita
                                                                            • Generative AIの品質は「誰が」保証するのか? 「GAN」から考える、“監視するAI”の必要性

                                                                              登壇者がゲームQAでのAI活用方法や、自動化の最新情報、品質保証の未来についてなどを話す「QA Tech Night vol.7~ゲームQA自動化とAI活用~未来のゲームテストを考えてみる~」。ここでモリカトロン株式会社の森川氏が登壇。「絵を描くAI」と「文章を生成するAI」の発展の流れから、これから顕在化する可能性のある問題について話します。 森川氏の自己紹介 森川幸人氏(以下、森川):時間なのではじめます。非常に具体的で実用的で、かつ先進的で未来を感じる松木さんと下田さんの講演の後に、とても申し訳ない講演になってしまうような気がしますが。この後の三宅さんの講演も座談会もおもしろいものになると思います。4分の1ぐらいちょっと外した話がある「QA Tech Night」が本来は成功ということで、ゆるく休憩というか、トイレタイムにでも使ってもらえればと思います。よろしくお願いします。 森川と

                                                                                Generative AIの品質は「誰が」保証するのか? 「GAN」から考える、“監視するAI”の必要性
                                                                              • 【SinGAN】たった1枚の画像から多様な画像生成タスクが可能に - Qiita

                                                                                はじめに 本記事はDeep learning論文紹介のAdvent Calender 2019の6日目の記事です。 本記事ではコンピュータビジョンのトップカンファレンスであるICCV2019でBest paperに選ばれたSin GANの論文について紹介し、公式のGitHubを色々触ってみようと思います。 SinGANは1枚の訓練データのみを学習に用いるので、気軽に画像生成を試すことができます(画像サイズにもよりますがGoogle colabratoryのGPUでおよそ1~5時間程度)。後半ではGoogle Colabratoryを用いて実際に画像生成を行っているのでぜひ試してみてください。 【SinGAN公式】 ・arxiv ・Github 【Qiitaの記事】 ・【論文解説】SinGAN: Learning a Generative Model from a Single Natura

                                                                                  【SinGAN】たった1枚の画像から多様な画像生成タスクが可能に - Qiita
                                                                                • Aydao.AI | Art + Machine Learning

                                                                                  Try out the interactive version: This Anime Does Not Exist (link). A custom variant StyleGAN2 model (512px resolution) trained on Danbooru2019. Notable changes include disabling stylemixing during training, forgoing path length regularization, using 2x feature maps, noconst (from the start), top-k (at convergence), and data augmentation using PALM (hands and figures augmentations), among other twe

                                                                                    Aydao.AI | Art + Machine Learning

                                                                                  新着記事