いまのところ利用できるのは、テキストから画像を生成する機能(Text to Image)とテキストに指定した効果を適用する機能(Text effects)、SVGファイルのカラーを変更する機能(Generative recolor)です。 「Text to Image」は、今やすっかりおなじみになった機能ですが、指定したテキストに沿った画像を生成してくれるというのも。なお、いまのところテキストは英語のみを受け付けています。 ▲「部屋の中でスマートフォンを手に持った可愛い女性」で生成 Adobe Fireflyでは、権利的にはっきりしているAdobe Stockの登録画像をAIの学習に利用しているので、商用利用などでも安心して行えるというのが特徴になっています。反面、学習する幅が狭くなっているため、出力されるバリエーションは少なめに感じました。 ちょっとおもしろいと思ったのが「Text ef
画像生成AI「Stable diffusion」の開発元であるStability AIが、参考画像を指定するだけで「参考画像に似た画像」を生成してくれるサービス「Stable diffusion reimagine」をリリースしました。記事作成時点では一部機能を無料で使用可能だったので、実際に使ってどんな画像を生成できるのか試してみました。 Stable diffusion reimagine https://clipdrop.co/stable-diffusion-reimagine Stable Diffusion Reimagine -Stability AI https://ja.stability.ai/blog/stable-diffusion-reimagine Stable diffusion reimagineにアクセスすると、以下のような画面が表示されます。画面内の点線
知人や他人が写り込んだ写真を知人や他人に許可なくSNSに投稿すると、インターネット上で誰でもアクセスできる。そのため、画像認識系の機械学習モデルのデータセットの一部として訓練に用いられ、悪用される可能性がある。 そこでこの研究では、共有したくない写り込んだ顔だけを偽の顔に置き換える深層学習モデル「MFMC」を提案する。ここでいう偽の顔とは、頭部姿勢や表情、光の反射具合はそのままに、年代や性別も維持した状態で、画像認識モデルに特定されない別人の顔を意味する。 モデルは、ArcFaceを用いて512の特徴量を持つ顔を抽出し、InsightFaceを利用して性別と年齢に基づく分類を行い、潜在空間における方向性に利用する。ディープフェイク生成にはSimSwapライブラリを用いる。 実際のデータセットについては、多様な環境をカバーするFacial Descriptors Datasetのpartyサ
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 香港城市大学と米Microsoft Research、Microsoft Cloud+AIによる研究チームが開発した「Bringing Old Films Back to Life」は、劣化の激しい古い白黒映画を修復しカラー映像に変換する深層学習フレームワークだ。古い映像にある独特のフィルムノイズなどを修復し、色付けを行う。 古い映画は、現代の観客の心にも響き感動を与えるが、フィルムの経年劣化による解像度の低下やアーチファクトにストレスを抱える視聴者もいるだろう。 このような古い映画をよみがえらせるために、映画の修復技術が開発されてきたが、1コマずつ丹念に調べ、傷のレタッチ、ちらつきの修正
これは、事前学習したStyleGANの画像生成と、エンコーダーをペアにしたエンド・ツー・エンドの画像間変換アーキテクチャで加齢をシミュレートする。1枚の人物画像と希望する年齢を、StyleGANの潜在空間にマッピングするために直接エンコードすることで、高品質な画像合成を生成するStyleGANの表現力を享受している。 年齢を他の顔の属性(表情や髪形など)から切り離した分離方法でモデルを学習しているため、元のアイデンティティーを損なうことなく、シワなどの質感から頭部の形まで精密な合成を生成する。 入力の年齢から希望する年齢への変化を回帰タスクで生成しているため、これまでのように大きく分けた年齢クラス(例えば、0~2、3~6、7~9、15~19、30~39、50~69歳)で顔を生成するのではなく、1歳ごとのより細かい年齢クラスでの制御を可能にした。動画では、年齢によって変化する顔画像のモーフィ
近年はデバイスや通信のプライバシーが向上した結果、児童性的虐待コンテンツ(CSAM)などの違法な画像のやり取りが容易になったという問題が生まれています。この問題に対処するため、端末に保存される画像から違法画像を検出する仕組みが開発されていますが、新たな研究で、「アルゴリズムをだまして検出システムを回避することは容易である」ということが示されました。 Adversarial Detection Avoidance Attacks: Evaluating the robustness of perceptual hashing-based client-side scanning | USENIX https://www.usenix.org/conference/usenixsecurity22/presentation/jain Proposed illegal image detecto
GoogleのAI研究チームであるGoogle AIが、低解像度画像にあえてノイズを追加して「純粋なノイズ」になるまで加工し、そこから高解像度画像を生成する「diffusion model(拡散モデル)」という手法を改善する新たなアプローチを発表しました。「画質の悪い低解像度画像から高解像度画像を生成する技術」には、古い写真の復元から医療用画像の改善まで幅広い用途が想定され、機械学習の活躍が期待されているタスクの1つです。 Google AI Blog: High Fidelity Image Generation Using Diffusion Models https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html Enhance! Google researchers detail new m
AIベンチャーのラディウス・ファイブ(東京都新宿区)は7月29日、AIを使って写真からアニメ用の美術背景を生成するサービス「Anime Art Painter」を始めた。写真をアップロードするだけでアニメ風の背景に変換できる。1枚の画像から4種類の背景を30秒程度で生成する。背景の生成は無料だが、画像のダウンロードは有料で料金は480円から。 大まかには、ディープラーニングを使い、写真のテクスチャ(質感)を簡略化。アニメやイラストに使われるような画風に変換する仕組みという。建物や夜景、山などの自然物、近距離で撮影した物体、屋内の背景など、物体に応じてテクスチャの変換や色合いを調整するという。生成される4種類の画像は、アニメでよく使われるような水彩風の絵を2種類と、べた塗りに近いアニメ風の絵が2種類。 同社は現在のアニメ業界について「制作が2年待ちといわれるほど行き詰まっている」と指摘する。
写真の顔部分を自動で切り抜き、それを基に画風の異なるPNG形式の画像5枚を生成する。サイズはいずれも512×512ピクセル。顔部分を切り取らず、人物全体から似顔絵を生成した画像1枚もおまけとして提供する。 同社が開発した、顔のしわなどを残した状態で画像を生成するAIと、逆にしわを減らして画像を生成するAIを活用。これらを組み合わせることで、モノクロなどしわが目立ちやすい画風でも、個人の顔の特徴を残した画像を生成できるようにした。それぞれのAIには、人間の顔写真とそれを基にした似顔絵の画像各600枚を学習させたという。 関連記事 写真を「ゴッホ風に」「ピカソっぽく」AIが自動加工 12種類の画風に対応 AIが写真をゴッホやピカソ風に加工するサービスが登場。AIは有名な画家の作風を学習しており、ファイルをドラッグ&ドロップするだけで変換できる。 赤ちゃんの顔をAIで予測 両親の顔写真をアップロ
東映アニメーションは3月12日、AIベンチャーのPreferred Networks(以下、PFN)のAI技術を活用してアニメ制作を効率化する実験を行ったと発表した。背景写真をアニメ調やサイバーパンク調に自動変換することで、美術クリエイターが画像の前処理にかける時間を従来の約6分の1に短縮できた。 長崎県佐世保市を舞台にした実験作「URVAN」(ウルヴァン)の制作に、画像処理AIを搭載したPFNの背景美術制作支援ツール「Scenify」(シーニファイ)を活用。佐世保市で撮影した風景写真をアニメ用の背景美術に自動変換し、美術クリエイターの負担を削減した。 背景美術の制作工程は、写真の配置、色調補正、アニメ調に変換、微調整、サイバーパンク調に加工の5段階。Scenifyはアニメ調に変換するとともに、キャラクターの前面に来るパーツと背面パーツに分ける作業や、空白部分を自然に塗りつぶす作業などを担
人工知能を使って生み出されたフェイクポルノを売買する闇市場が、AI先進国・中国で広がりをみせているという。「ディープフェイク」という画像・動画生成AIの登場は報じられて久しいが、いよいよ市場に“サービス”として普及し始める段階にいたったようだ。 中華系各メディアは、国内で芸能人の顔を合成したフェイクポルノの闇市場が生まれつつあると指摘。その背景とされているのは、AI技術の低価格化だ。 フェイクポルノの生成を請け負う業者は、オンラインで顧客を集客。WeChatやAlipayなどを通じて決済を受けた後、クラウドストレージなどのURLなどを送って商品を提供する。フェイクポルノの価格は質や長さによって異なるが、確認されたところによると700本の動画がセットになった商品が約158元(約2470円)で販売されていた事例があったという。 一方、顧客が選んだ芸能人や一般人の写真・動画を素材にし、カスタマイ
早稲田大学の研究グループが発表した白黒写真を自然な色味に自動彩色する手法を、Webブラウザ上で実行できるサービスをmecab(@mecab)さんが公開した。 早大の研究グループが発表したのは、大量の白黒・カラー画像の組から、色づけの手がかりとなる特徴をディープラーニングにより学習し、その特徴を使って白黒画像をカラーに変換する技術。ユーザーテストでは、約90%が「色付け結果が自然だ」と回答したという。 mecabさんが公開したWebサービスは、論文の著者らがGitHubで公開しているデモ実装を基に、ブラウザ上で動作するようにアレンジしている。画像をアップロードすると、1度グレースケール画像に変換した後に、この手法でカラー化した結果を表示する。 学習データの関係上、屋外で撮影した写真の方がよい結果が出やすいようだ。mecabさんは「海についてはむしろより自然色に近くなっているように見える。すご
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く