並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 524件

新着順 人気順

画像合成の検索結果241 - 280 件 / 524件

  • Railsで画像合成や文字入れをする【RMagick】 - SakuraWi - BLog

    RMagickを利用して画像の合成や文字入れをしたい 入力した内容に応じて画像を合成したり、 入力文字をいれた画像を作ったりするときの Tips 例で言うと、サムネイル作成、とかかな? Rmagickのインストール gemfileに以下を追加 gem 'rmagick' そして bundle install 画像を合成するコード image = Magick::ImageList.new( "app/assets/images/test.png", "app/assets/images/test2.png", ) image = image.append(false) #falseだと左右につなげる。trueだと上下につなげる image.write("app/assets/images/result.png") Magick::ImageList.new で画像が配列に格納されるようなふ

      Railsで画像合成や文字入れをする【RMagick】 - SakuraWi - BLog
    • AI絵師に異世界文字を書かせる | スラド IT

      AIによる画像合成技術では現在、文字を正確に認識できない特性が存在するという。あろえ・きゃんどるさんは、この仕様を逆に利用して『AIに異世界文字書かせる』ことができるのではないかと思いついたそうだ。漢字やカタカナなどをもとに実際にやってみたところ、もとの文字とは似て非なる見事な異世界文字を生成することに成功したそうだ。同氏は「最近叩かれがちなAI先生の良い面が広められてよかったぜ!!結局は使い方なんだよなぁ!! 」とAI製の文字のできばえを褒め称えている(あろえ・きゃんどるさんのツイート、Togetter)。

      • 画像合成と画像認識のための学習開始の注意

        Learning Inception Attention for Image Synthesis and Image Recognition 画像合成と画像認識は目覚ましい進歩を遂げましたが、多くの場合、計算コストのかかるトレーニングと推論が犠牲になります。軽量でありながら表現力豊かなディープモデルを学ぶことは、重要で興味深い方向性として浮上しています。 Inceptionビルディングブロックのよく知られたsplit-transform-aggregateデザインヒューリスティックに触発されて、このペーパーは、画像合成モデルの効率的な学習を容易にするSkip-Layer Inception Module(SLIM)と、同じレイヤーバリアント(SLIMと呼ばれる)を提案します。あまりにも)画像認識のための有名なResNeXtsのより強力な代替手段として。 SLIMでは、入力特徴マップは最初に

          画像合成と画像認識のための学習開始の注意
        • 産総研: リモートセンシング研究グループ (リンク)

          ■ 衛星でとらえた世界の自然災害 2022年8月3日に新潟県村上市周辺で発生した斜面崩壊地周辺の衛星画像前後比較と地質概説(ASTER image courtesy NASA/METI processed by GSJ, AIST) 2022年2月3日 衛星画像で見るフンガ火山(トンガ王国)の2000年から2022年に至る地形変化(ASTER image courtesy NASA/METI processed by GSJ, AIST) 2021年08月31日 福徳岡ノ場、8月13日以降の火山活動の衛星解析概説(ASTER image courtesy NASA/METI processed by GSJ, AIST) 2021年07月08日 熱海土砂災害地域周辺の時系列ASTER画像(ASTER image courtesy NASA/METI processed by GSJ, AI

          • 研究目的に活用できる10万枚の「脳画像合成データ」のオープンソース提供へ 英国KCL | Med IT Tech

            英国キングス・カレッジ・ロンドンが、パートナー企業やオープンソースのソフトウェアを活用して開発したAIモデルを用いて、脳の合成画像を10万枚生成しオープンソースとして公開すると発表した。AIを生成する教師データとなる医用画像は世界的に不足しているといわれており、こうした脳画像の合成技術が普及すれば、関連研究を大きく前進させることが期待できる。 画像はGitHubに公開予定 同大学の発表によると、同大学と関連機関、米NVIDIAは人間の脳の人工3DMRI画像を生成する深層学習モデルの構築を目的としたプロジェクト「Synthetic Brain Project」を組織しており、ディープラーニングや多くのフレームワーク、NVIDIAのハードウェアを採用し高精度な「存在しない人の」高精度な脳画像を生成できるモデルの開発に成功したという。精度を確認できるサンプルも公開されている。 医用画像を解析する

              研究目的に活用できる10万枚の「脳画像合成データ」のオープンソース提供へ 英国KCL | Med IT Tech
            • 逆畳み込み - Wikipedia

              Richardson–Lucy(英語版)アルゴリズムによる逆畳み込み前と逆畳み込み後のコペルニクス・クレーターの比較画像。他の処理は行っていない。 数学では、逆畳み込み (デコンボリューション, deconvolution) は、記録されたデータからの信号を強化するために使用されるアルゴリズムベースの手続きである。記録されたデータが、フィルタ (畳み込みと呼ばれる手順) によって歪められた純粋な信号としてモデル化できる場合、元の信号を復元するために逆畳み込みを使用して基の信号を復元することができる。[1] 逆畳み込みの概念は、信号処理や画像処理の技術で広く使われている。 逆畳み込みと時系列分析の基礎は、マサチューセッツ工科大学のノーバート・ウィーナーによって、彼の著書『Extrapolation、Interpolation、and Smoothing of Stationary Time

                逆畳み込み - Wikipedia
              • 「ハリー・ポッター スタジオツアー東京」「としまえん跡地」に2023年 夏 オープン決定!ワーナー ブラザース スタジオツアー東京 – メイキング・オブ・ハリー・ポッター が日本へやってくる!

                東京 としまえん跡地「ハリー・ポッター スタジオツアー東京」2023年 夏 オープン WARNER BROS. STUDIO TOUR TOKYO | THE MAKING OF Harry Potter ワーナー ブラザース スタジオ ジャパン合同会社(東京都港区トーベン・イェンセンGM)は、2023年夏に東京都練馬区の「としまえん跡地」に「ワーナー ブラザース スタジオツアー東京 – メイキング・オブ・ハリー・ポッター」を開業することを発表しました。 ワーナー ブラザース スタジオツアー東京 – メイキング・オブ・ハリー・ポッターとは としまえん跡地に開業するこの「ワーナーブラザース スタジオツアー東京」は、世界中で愛される映画「ハリー・ポッター」や「ファンタスティック・ビースト」シリーズの製作の裏側を実際に体験できる、全く新しいウォークスルー型のエンターテイメント施設です。 参考写真

                  「ハリー・ポッター スタジオツアー東京」「としまえん跡地」に2023年 夏 オープン決定!ワーナー ブラザース スタジオツアー東京 – メイキング・オブ・ハリー・ポッター が日本へやってくる!
                • Python + OpenCVによるマスク画像適用方法 - Qiita

                  OpenCVで画像に対しマスク画像を適用し特定範囲を任意の色にする 下記コードは、マスク画像黒部分を灰色で塗りつぶす import cv2 # マスク対象画像読み込み img = cv2.imread("testImg.png",cv2.IMREAD_COLOR) # マスク画像読み込み imgMask = cv2.imread("testImgMask.png",cv2.IMREAD_GRAYSCALE) # マスク画像合成 img[imgMask==0] = [128, 128, 128] # マスク画像の明度 0 の画素を灰色(R:128 G:128 B:128)で塗りつぶす # マスク結果画像を保存 cv2.imwrite("testDstImg.png", img)

                    Python + OpenCVによるマスク画像適用方法 - Qiita
                  • ウイスキーのビンの撮影の仕方 | 商品撮影、物撮り,スタジオ撮影、写真撮影は【ABstudio】 新宿の自社スタジオ完備

                    本日は切り抜き対応のビン物の撮影方法を簡単にレクチャーしましょう。 撮影作業内容 撮影するのはMHDのGLENKINCIEです。 1.背景から光を入れるために乳白の透過できる背景を用意します。瓶内でウイスキーの琥珀色にグラデーションが出るようにライティングします。 2.ウイスキーのボトル内の色の再現 これも背景からの光を工夫して色を出します。 3.裏写りするボトルの文字の消し方 文字が裏に書いてあれば必ず裏写りします。これを画像処理ではなく消します。 4.ラベルの曲がりの修正 どうしても曲がってついているものが多いので画像修正で対応いたします。 透過光の撮影 透明のビンを後ろから光を入れないと上の写真のように透明感のない写真になってしまいます。 まずは後ろからトレペ越しに光を入れてみましょう。 瓶裏のロゴ消去 ウイスキーの琥珀色は表現出来ましたが、背後の文字が見事に写ってしまっています。

                      ウイスキーのビンの撮影の仕方 | 商品撮影、物撮り,スタジオ撮影、写真撮影は【ABstudio】 新宿の自社スタジオ完備
                    • Googleの新フラッグシップスマホ「Pixel 4」と「Pixel 4 XL」を写真と動画で紹介!デュアルカメラと最新のAndroid機能を搭載【レポート】 : S-MAX

                      Googleの新フラッグシップスマホ「Pixel 4」と「Pixel 4 XL」を写真と動画で紹介!デュアルカメラと最新のAndroid機能を搭載【レポート】 2019年10月26日06:55 posted by mi2_303 カテゴリMVNO・SIMフリーイベント・レポート list グーグルの最新スマートフォン「Pixel 4・4 XL」が発売! 既報通り、グーグル(以下、Google Japan)は16日、都内にて「ハードウェア新製品記者発表会」を開催し、デュアルカメラを搭載した最新フラッグシップスマートフォン(スマホ)「Pixel 4(型番:G020N)」および「Pixel 4 XL(型番:G020Q)」を2019年10月24日(木)に発売することを発表した。 SIMフリー版がグーグルの公式Webショップ「Google ストア」での取り扱いされるほか、ソフトバンクの携帯電話サービ

                        Googleの新フラッグシップスマホ「Pixel 4」と「Pixel 4 XL」を写真と動画で紹介!デュアルカメラと最新のAndroid機能を搭載【レポート】 : S-MAX
                      • OMDSが天体用カメラ「OLYMPUS E-M1 Mark III ASTRO」を正式発表

                        OMDSが天体用カメラ「OLYMPUS E-M1 Mark III ASTRO」を正式発表 OMDS(OM SYSTEM)が、E-M1 Mark III の天体撮影用バージョン「OLYMPUS E-M1 Mark III ASTRO」を正式に発表しました。 ・E-M1 MarkIII ASTRO OM SYSTEM E-M1 MarkIII ASTROは、ミラーレス一眼カメラE-M1 MarkIIIの撮像センサー前方に配置されているIRカットフィルターを天体撮影用に最適化し、天体写真愛好家に人気の高い赤い星雲を色鮮やかに撮影することが出来る天体撮影専用カメラ。 本製品に付属するフィルターやOM SYSTEMのコンピュテーショナル フォトグラフィ、M.ZUIKO DIGITALレンズにより、星景写真から星座、星雲撮影といった本格的な天体写真まで幅広い表現を可能に。 天体撮影で重要となるHα線

                          OMDSが天体用カメラ「OLYMPUS E-M1 Mark III ASTRO」を正式発表
                        • やばい!画像生成AIのド本命が爆速化。リアルタイム生成対応「SDXL Turbo」(アスキー) - Yahoo!ニュース

                          Stability AIは11月29日、テキストからのリアルタイム生成に対応した画像生成モデル「SDXL Turbo」を発表した。 【もっと写真を見る】 Stability AIは11月29日、テキストからのリアルタイム生成に対応した画像生成モデル「SDXL Turbo」を発表した。 同モデルはこれまでの「SDXL 1.0」に対して、新たな蒸留技術「敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)」を導入したモデル。ADDの導入により、SDXL Turboは1ステップでの画像合成のほか、他の蒸留手法でよく見られるアーチファクト(ノイズ)やぼやけを回避することも可能となった。 SDXL Turboのご紹介: リアルタイムテキスト画像生成モデル。 SDXL Turboは、新しい蒸留技術によって最先端のパフォーマンスを実現し、必要なステップ数を50か

                            やばい!画像生成AIのド本命が爆速化。リアルタイム生成対応「SDXL Turbo」(アスキー) - Yahoo!ニュース
                          • [FactCheck] 「安倍総理マスク画像は合成」は根拠不明 多数のメディアが同様の写真撮影

                            安倍晋三首相が8月24日慶應大病院に受診する時の様子を写した写真が、マスクの紐が途切れているように見えるため「合成」だとの指摘がツイッターで拡散した。しかし同じタイミングで別の撮影者が写したものでも、同じような見え方をする写真・映像が複数確認できた。(大船怜) チェック対象 「安倍総理の顔色を悪くするために画像補正したら、マスクがくすんだので合成したようです」などとする画像付きの投稿 (2020年8月24日、ツイッター投稿) 結論 【根拠不明】 同じタイミングで複数のメディアの別の撮影者が写したものでも、同じような見え方をする写真・映像が複数確認できた。異なるメディアが同時に同じような合成写真・映像を作るとは考えにくい。 投稿は、8月24日に都内の病院を訪れた安倍晋三首相を写した写真(実際は毎日新聞でなく朝日新聞によるもの)について、メディアが健康不安説を煽るため意図的に加工したと主張して

                              [FactCheck] 「安倍総理マスク画像は合成」は根拠不明 多数のメディアが同様の写真撮影
                            • Apple Watchを一瞬で装着できるマグネットベルトが快適だった。 - iPhoneケース・カバーならAB-Next

                              製品仕様はこちら。 製品名:WEARPLANET Slim Line Magnet Link Band for Apple Watch 対応サイズ:45/44/42mm用、41/40/38mm用 製品種別:Apple Watch用バンド ブランド:WEARPLANET(ウェアプラネット) 販売元:株式会社ロア・インターナショナル(東京都新宿区) 重量:13g(45/44/42mm)、(41/40/38mm) サイズ:横15mmx縦120mm&97mm×厚み3mm※ラグ含む(45/44/42mm)、横14mmx縦120mm&97mm×厚み3mm※ラグ含む(41/40/38mm) 材質:合成皮革、マグネット ベルト着脱方式:マグネット※手首周り180mm以上の場合、バンドがうまく取り付けられない可能性あり。 原産地:中国 対応機種:45/44/42mm用→Apple Watch 45mm(Se

                                Apple Watchを一瞬で装着できるマグネットベルトが快適だった。 - iPhoneケース・カバーならAB-Next
                              • 『セルフプロデュースとオンライントーク』

                                Shenlong シェンロン 1分でも早く寝ろ!@MsNATARY 龍一 昌磨 草太 これくらい派手にぶち上げて https://t.co/vDA1IelJfU 2020年07月18日 18:59 ビンセントがすごすぎる こんなん自分で出せれるんだ うちの子たちこれくらいがせいぜいだし あー ゲームやマンガ読んどらずに 映像編集くらいできる様になれよだし JPlanningIntl@JPlanningIntl 友野一希×山本草太オンライントークショー、とうとう明日開催です! 今回のイベントは、16:30より入場開始となります。ご購入のPDFに記載されたURL・パスワードでご入場ください☺️ 入場方法詳細は、以下ツイートでご紹介しており… https://t.co/yZEeTQwHlx 2020年07月18日 18:10 いよいよオンライントークは明日 正直・・・義理の父親が昨日危篤になり

                                  『セルフプロデュースとオンライントーク』
                                • AI画像合成技術で自分の顔を使用され、アダルトビデオに出演させられてしまうサイトに専門家が警鐘 : カラパイア

                                  人工知能は素晴らしい可能性を示すとともに、人間のダークサイドをも暴き出している。例えば「ディープフェイク(画像合成技術)」は、機械学習を通じて、画像や動画に本来写っていないものを合成することができる。 これを使えば誰でも簡単にフェイク動画や画像を作成できてしまう。最近このディープフェイクを利用して、懸念すべきサイトが登場したという。 『MIT Technology Review』によると、そのサイトでは顔写真をアップロードすることで、その人を勝手にアダルトビデオに出演させることができるのだ。 それがダウンロードされて拡散されれば、とんだ風評被害を作りかねないとして大いに懸念されている。

                                    AI画像合成技術で自分の顔を使用され、アダルトビデオに出演させられてしまうサイトに専門家が警鐘 : カラパイア
                                  • 最新望遠鏡で原始の宇宙へ

                                    ジェームズ・ウェッブ宇宙望遠鏡は、これまでで最も深遠な宇宙で輝く無数の恒星や銀河を見せてくれる。中央に見えるのは、背景にある銀河からの光をゆがめる銀河団だ。(画像合成:NASA, ESA, CSA, STSCI) 史上最大にして最高の機能を誇る「ジェームズ・ウェッブ宇宙望遠鏡」が知られざる宇宙の起源に迫る。 今から138億年近く前、宇宙がまだ若かったとき、暗黒の空間に星は一つもなかった。 天文学では「暗黒時代(ダークエイジ)」と呼ぶこの時代は、その後の宇宙に誕生するすべてのものの原料となる水素とヘリウムで満たされていた。そこには正体不明の物質「暗黒物質(ダークマター)」も存在し、その重力が水素とヘリウムのガスを引きつけて複雑な網状の構造を作っていた。それが膨張して温度が下がると、ダークマターの一部が巨大な球状に固まり始め、その核にガスが集まる。「ハロー」と呼ばれるその球状の構造内部で重力が

                                      最新望遠鏡で原始の宇宙へ
                                    • 【笑い男事件2024】OpenCVで顔を検出して笑い男にする - Qiita

                                      笑い男事件発生 Qiitaを利用しているプログラマやエンジニアのほとんどが履修してるであろう作品、「攻殻機動隊」。その中の2002年から2003年に放映されたシリーズ「STAND ALONE COMPLEX」の劇中に出てくる笑い男事件と呼ばれる一連の事件の発端が2024年の2月に起こります。 ついに、時代が追い付きました!まだ電脳化もしてないのに…w。 笑い男事件の詳細を知らない方は、この機会に攻殻機動隊SACを観ましょう。 2024年2月、笑い男事件発生。 ここから何が始まる?詳細情報は特設サイトで…https://t.co/b4m9uAXn7u#攻殻機動隊 #ghostintheshell #standalonecomplex #笑い男2024 #thelaughingman2024 — 攻殻機動隊【公式】GHOST IN THE SHELL official (@thegitsoff

                                        【笑い男事件2024】OpenCVで顔を検出して笑い男にする - Qiita
                                      • 機械学習と向き合った「iPhone 15のカメラ」 アップル責任者が語るユーザーの反響 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                                        アップルが9月に発売したiPhone 15の販売が好調であるという。その勢いを受けて、ティム・クックCEOも同社第4四半期の業績発表の中で、iPhone 15の強力なランナップを揃えて迎える2023年のホリデーシーズンに期待を寄せていた。 アップルには、iPhone 15の各モデルを手にしたユーザーからのフィードバックが続々と集まっている。よりパワフルになったiPhone 15のカメラ機能や機械学習は、スマートフォンでの「撮影」という体験をどのように変えるのか。ワールドワイドiPhoneプロダクトマーケティング担当バイスプレジデントのカイアン・ドランス氏にインタビューした。 カメラの大きな進化が「iPhoneの買い換え」を促す やはりというべきか、iPhone 15が発表されてからiPhone 11やiPhone 12のシリーズ機を数年に渡り使い続けてきたユーザーによる「買い換え」が進んで

                                          機械学習と向き合った「iPhone 15のカメラ」 アップル責任者が語るユーザーの反響 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                                        • キヤノンDPPから画像合成なしで簡単にHDR画像がプリントできる!【CP+2019】 | CAPA CAMERA WEB

                                          カメラと写真映像のワールドプレミアショー「CP+2019」(2019年2月28日~3月3日/パシフィコ横浜)会場から写真でレポート! 注目の新製品や各社のイチオシ、取材スタッフが見つけた注目アイテムを紹介します。 【キヤノン】入力から出力までをフルカバーするキヤノンの強みをいかしてプリンターも進化! キヤノンブースのプリンターコーナーではスマホ専用ミニフォトプリンター「iNSPiC」の体験コーナーが設けられていた。スマートフォンで撮影した画像をすぐにプリントして見ることができる。こちらでは女性スタッフがわかりやすく説明してくれる。 「iNSPiC」の体験コーナーのすぐ後ろでは、フォトキナで技術展示されていたHDRプリントが紹介されていた。対応機種はカメラが「EOS 5D Mark IV」と「EOS R」、プリンターがimagePROGRAF PROシリーズに限定されるものの画像合成をするこ

                                            キヤノンDPPから画像合成なしで簡単にHDR画像がプリントできる!【CP+2019】 | CAPA CAMERA WEB
                                          • KDDI Open Innovation Fund 2号、AIを活用したマーケティングソリューション「Vue.AI (ヴュー エーアイ)」を提供するMad Street Den Inc.に出資

                                            KDDIホーム 企業情報 ニュースリリース一覧 2018年 KDDI Open Innovation Fund 2号、AIを活用したマーケティングソリューション「Vue.AI (ヴュー エーアイ)」を提供するMad Street Den Inc.に出資 KDDI Open Innovation Fund 2号、AIを活用したマーケティングソリューション「Vue.AI (ヴュー エーアイ)」を提供するMad Street Den Inc.に出資 KDDI株式会社 2018年9月4日 KDDI株式会社 (本社: 東京都千代田区、代表取締役社長: 高橋 誠、以下 KDDI) は、有望なベンチャー企業への出資を目的とした「KDDI Open Innovation Fund 2号」(運営者: グローバル・ブレイン株式会社、以下 KOIF2号) を通じて、アパレルEコマース領域におけるAIを活用した統

                                              KDDI Open Innovation Fund 2号、AIを活用したマーケティングソリューション「Vue.AI (ヴュー エーアイ)」を提供するMad Street Den Inc.に出資
                                            • OpenAI が多言語音声認識システムである「Whisper」をオープンソース化 - インタビューやポッドキャストの文字起こしが可能に? | TEXAL

                                              OpenAIは2日、人間の認識能力に近いレベルで音声を認識・翻訳する新しいオープンソースAIモデル「Whisper」を公開した。これにより、インタビューやポッドキャスト、会話などの文字起こしが可能だ。 Google、Amazon、Metaといったハイテク企業のソフトウェアやサービスの中核をなす、高性能な音声認識システムは、これまでにも数限りなく開発されてきた。今回、OpenAIは、68万時間に及ぶ音声データと、ウェブから収集した98言語のトランスクリプトを照合し、Whisperをトレーニングしている。これによって、“アクセント、背景雑音、専門用語に対する堅牢性の向上”につながったとのことだ。また、話し言葉を検出し、英語に翻訳することも可能だという。 OpenAIは、Whisperをエンコーダーデコーダートランスフォーマー(入力データから得られる文脈を利用して、モデルの出力に変換できる関連性

                                              • 画像加工や合成・文字入れもできるサイト「フォトファニア」

                                                画像や写真を加工・合成・文字入れする時はイラストレーターやPhotoshopを使うと思いますが、ソフトを一切使わなくてもできます。 それが「PhotoFunia(フォトファニア)」という無料webサービス。 このサイトを使えば、今まで画像編集ソフトが必要だった画像加工や合成・文字入れがWEB上で簡単、そして無料でできます。 通常のwebサイトにはもちろん、ブログのアイキャッチ画像作りにもピッタリなので、是非使って見て下さい。 フォトファニアとは フォトファニア(PhotoFunia)は、web上で画像合成や加工・文字入れといった編集が無料でできるwebサイトです。 このサイトはいわゆる無料モックアップツールのようなもので、数百種類あるエフェクトの中から好きなものを選んで、手持ちの画像と組み合わせる事ができます。 例えば画像と画像を組み合わせて合成したり、画像の中に好きな文字を入れたり、写真

                                                  画像加工や合成・文字入れもできるサイト「フォトファニア」
                                                • 制御可能な人物画像合成のためのニューラルテクスチャの抽出と分布

                                                  Neural Texture Extraction and Distribution for Controllable Person Image Synthesis 身体のポーズと外観を明示的に制御して、参照画像から人間を再レンダリングすることを目的とした、制御可能な人物画像合成タスクを扱います。人物画像が高度に構造化されていることを観察し、参照画像の意味エンティティを抽出して配布することにより、目的の画像を生成することを提案します。この目標を達成するために、二重注意に基づくニューラルテクスチャ抽出および分散操作について説明します。この操作では、最初に参照フィーチャマップからセマンティックニューラルテクスチャを抽出します。次に、ターゲットポーズから学習した空間分布に従って、抽出されたニューラルテクスチャを分散します。私たちのモデルは、任意のポーズで人間の画像を予測するように訓練されています

                                                    制御可能な人物画像合成のためのニューラルテクスチャの抽出と分布
                                                  • M6-UFC:非自己回帰生成トランスを介した条件付き画像合成のためのマルチモーダル制御の統合

                                                    M6-UFC: Unifying Multi-Modal Controls for Conditional Image Synthesis via Non-Autoregressive Generative Transformers 条件付き画像合成は、テキストによる説明、参照画像、保存する画像ブロック、およびそれらの組み合わせの形式で、いくつかのマルチモーダルガイダンスに従って画像を作成することを目的としています。この論文では、これらの制御信号を個別に調査する代わりに、新しい2ステージアーキテクチャであるM6-UFCを提案して、任意の数のマルチモーダル制御を統合します。 M6-UFCでは、多様な制御信号と合成された画像の両方が、Transformerによって処理される一連の個別のトークンとして均一に表されます。 DALL-EやVQGANなどの既存の2段階自己回帰アプローチとは異なり、M6

                                                      M6-UFC:非自己回帰生成トランスを介した条件付き画像合成のためのマルチモーダル制御の統合
                                                    • 使うのは訓練済みStyleGANだけ!? 追加訓練なしで複数の画像合成タスクを実現する - Qiita

                                                      2021年のディープラーニング論文を1人で読むAdvent Calendar3日目の記事です。今回紹介するのはStyleGANの応用です。StyleGANといえばGANの中でもトップクラスに注目されているモデルで、2020年にはStyleGAN2が生まれました。 この研究はGANの訓練を一切せずに、パノラマ合成や、画像ブレンド、局所的なマルチモーダル画像変換など複数の画像合成タスクをこなすものです。高価なGPUがいらないので利用しやすい研究ではないかと思います。2021年11月現在はpreprintとなっています1。イリノイ大学とSnap社のメンバーによる論文です。 タイトル:StyleGAN of All Trades: Image Manipulation with Only Pretrained StyleGAN URL:https://arxiv.org/abs/2111.0161

                                                        使うのは訓練済みStyleGANだけ!? 追加訓練なしで複数の画像合成タスクを実現する - Qiita
                                                      • Photoshop ニューラルフィルター「調和」の使い方 | パソコン工房 NEXMAG

                                                        Adobe Photoshop 2022(以下Photoshop)で進化した「ニューラルフィルター」の中で、「2022」(バージョン23.0)から新たに搭載された機能「調和」について解説します。長年のPhotoshopユーザーでありクリエイターの海津ヨシノリさんが検証しています。 ※ここでの検証は、Adobe Photoshop 2022(バージョン23.0)で行っています。 ニューラルフィルター「調和」の実行手順 Photoshopに搭載しているニューラルフィルターの「調和」は、切り抜き画像と新しい背景画像との調和を自動処理してくれるツールです。「2022」(バージョン23.0)ではベータ版として用意されています(2022年3月時点)。 はじめに一通りの手順を解説します。まず人物写真を用意します(ここでは下のフリー素材を使用)。 “woman looking left side whil

                                                          Photoshop ニューラルフィルター「調和」の使い方 | パソコン工房 NEXMAG
                                                        • 画像生成ジェネレーター「Stable Diffusion」によって優れた画像圧縮が出来る可能性が示される | TEXAL

                                                          スイスのソフトウェアエンジニアMatthias Bühlmann氏は、最近人気の画像合成モデルStable Diffusionが、注意点はあるものの、既存のビットマップ画像を高い圧縮率でJPEGやWebPよりも圧縮することが出来る事を発見し、自身のサイトで公開している。 Stable Diffusionは、テキスト記述(「プロンプト」と呼ばれる)に基づき画像を生成するAI画像合成モデルだ。このAIモデルは、インターネットから取得した数百万枚の画像を学習することで、テキストから画像を生成する術を身につけた。学習過程で、画像と関連する単語の統計的な関連付けを行い、各画像の重要な情報をかなり小さくまとめ、「重み」として保存する。これは、いわばAI画像モデルが得た知識を表す数学的な値だ。 Stable Diffusionが画像を解析し、重みの形に「圧縮」するとき、画像は研究者が「潜在空間」と呼ぶ場

                                                            画像生成ジェネレーター「Stable Diffusion」によって優れた画像圧縮が出来る可能性が示される | TEXAL
                                                          • 「ディープフェイク」の現状と将来についてセミナーを開催

                                                            AI(人工知能)テクノロジー企業のAppier(エイピア、共同創業者/CEO:チハン・ユー、以下Appier)は、「ディープフェイク」の現状と将来をテーマに、オンラインセミナーを開催しました。当日は、AppierのチーフAIサイエンティストのミン・スンが、「ディープフェイク」の誕生の経緯と社会的なインパクト、今後の期待される応用例を解説しました。 1.    「ディープフェイク」の誕生 ~20年前からある「人物画像合成技術」~ 「ディープフェイク」とは、ディープラーニングを活用したフェイク画像/動画を指し、ディープラーニングの「ディープ」と、フェイク画像/動画の「フェイク」を組み合わせた言葉です。2017年にとあるハッカーが、ソフトウェア・パッケージという形でリリースし、それがオープンソースだったため公に広まりました。このハッカーが、そのソフトウェアにつけた名前が「ディープフェイク」です。

                                                              「ディープフェイク」の現状と将来についてセミナーを開催
                                                            • 【DeepFake】ついにうちのワンコが喋り始めました - Qiita

                                                              ①はじめに なにかアウトプットがあるとAIをやった気になって楽しいですよね。今回はちまたで話題のDeepFakeをやってみたいと思います。 ②DeepFakeとは DeepFakeとは、深層学習と偽物を組み合わせた造語で、人工知能にもとづく人物画像合成技術のことです。サンプルを見ると楽しさが分かると思いますが、今回は「first-order-model」を利用して、静止画のワンコを喋らせてみたいと思います。 ③TRY では、早速やってみましょう! 環境は、プログラムを動作させるのはGPUが使えるのでGoogle Colab、データの格納はGoogle Driveでやります。 ■事前準備 Google Driveで実施してください。 事前準備として、各種データ(チェックポイント、動画、静止画)をGoogle Driveへ格納します。 ➊データ格納フォルダ作成 Google Driveのマイド

                                                                【DeepFake】ついにうちのワンコが喋り始めました - Qiita
                                                              • No. 2190 NASAの月面着陸に関する証拠

                                                                Evidence Relating to NASA Moon Landings 説明のつかない不備:何が現実で何が幻想か? by Mark Keenan 以下は、『偽の月面着陸とNASAの嘘』(2024年)と題された著書に基づく、マーク・キーナンの入念に調査された分析である。 最近の動きとしては、米国の宇宙船が50年以上ぶりの月面着陸を試みた。 “絶望的……地球との衝突コース”? インデペンデント紙 {0}は次のように報じた: 「ピッツバーグを拠点とする宇宙企業アストロボティック社による「ペレグリン・ミッション・ワン」と名付けられた民間ミッションは、先週の月曜日(2024年1月8日)に地球を出発し、2月23日に月面に着陸する予定だった。 しかし、燃料漏れがその運命を決定づけた。打ち上げから約30時間後、同社は宇宙船が月面に軟着陸する「可能性がない」ことを認めた。 宇宙船に関する最新の情報で

                                                                  No. 2190 NASAの月面着陸に関する証拠
                                                                • vivo X70 Pro+ レビュー V1チップ搭載で夜景撮影は敵なし。目が覚める高いカメラ性能に驚かされるスマートフォン - はやぽんログ!

                                                                  どうも。今年はカメラ特化スマホが目白押し世間ではiPhone 13シリーズで湧き上がるなか、ひねくれた筆者はこんなスマホを代わりに買いました。 vivo X70 Pro+です。カメラです。 来てしまいました。 VIVOのカメラが。届きました。 もう今年スマホ買わなくていいかな… pic.twitter.com/IjJpfWNY6m— はやぽん (@Hayaponlog) 2021年9月26日 カメラ性能の強化を続けるvivoのスマホ。その最高峰がX70 Pro+ X60のマイナーチェンジにとどまらない。ZEISSナチュラルカラーとV1チップで別物に進化したX70 Pro+ カメラだけではない。全方位に進化したvivo X70 Pro+ 普段使いのしにくさからお勧めできないが、カメラ性能はすばらしいX70 Pro+ 最後に、X70 Pro+はカメラで選ぶならマストバイ、スマホで選ぶなら別を選

                                                                    vivo X70 Pro+ レビュー V1チップ搭載で夜景撮影は敵なし。目が覚める高いカメラ性能に驚かされるスマートフォン - はやぽんログ!
                                                                  • 女優の「裸画像」合成、「有名税」では済まされない…雑誌出版社の賠償命令確定 - ライブドアニュース

                                                                    2016年7月6日 10時9分 by ライブドアニュース編集部 ざっくり言うと 女優らがアイコラ掲載の出版社に求めていた訴訟の損害賠償が確定した 有名税があるとは言えども、セクハラ表現は受け入れる必要がないと弁護士 今回の判決では、芸能人に対しての名誉感情侵害が認められているという さんやさんら女優7人が、自身の写真と裸のイラストとの合成画像の掲載をめぐって、雑誌出版社に損害賠償を求めていた訴訟で、出版社側に計560万円の支払いを命じた二審知財高決が6月29日までに確定した。 一審の東京地裁は、「イラストは一見して合成と判別できないほど精巧」「女性に強い羞恥心や不快感を抱かせ、自尊心を傷つける」として、賠償を命じ、二審も支持していた。7人は二審判決の一部を不服として上告受理を申し立てていたが、28日付で不受理が決まり、二審判決が確定した。 報道によると、問題となった雑誌には、訴えた7人を含

                                                                      女優の「裸画像」合成、「有名税」では済まされない…雑誌出版社の賠償命令確定 - ライブドアニュース
                                                                    • ユニティ・テクノロジーズ・ジャパン、Unityでレイヤーを使った画像合成を行う「Visual Compositor」の紹介動画を公開。Stable Diffusionと連携する機能も紹介

                                                                      ユニティ・テクノロジーズ・ジャパンが、Unityで画像合成を行う機能「Visual Compositor」の紹介動画を公開 「Visual Compositor」では、ノードベースのエディタを通して、Unity内でリアルタイムの画像合成が可能 動画では、試験的に使えるStable Diffusionとの連携機能についても解説

                                                                        ユニティ・テクノロジーズ・ジャパン、Unityでレイヤーを使った画像合成を行う「Visual Compositor」の紹介動画を公開。Stable Diffusionと連携する機能も紹介
                                                                      • 国立天文台長 新年のご挨拶|国立天文台(NAOJ)

                                                                        昨年に引き続き、年明け早々から新型コロナウイルスが世界的に猛威を振るい、国立天文台も感染防止対策と研究活動・望遠鏡運用を並走させる困難な運営を強いられる状況が続いています。医療従事者の皆様ならびにエッセンシャルワーカーの皆様に感謝を申し上げるとともに、感染症の早期の終息を願っています。 昨年始めから、国立天文台執行部の意思決定プロセスやコミュニティとの意思疎通に関して国立天文台執行部への問題提起がなされ、昨年12月に、国立天文台コミュニティ間意思疎通推進委員会より、「我が国の天文学の発展のために - 中間報告書」が発行されました。報告書の指摘事項と改善提案を重く受け止めています。今後発行される最終報告書も見据えて、台内はもちろん関連コミュニティとの円滑な意思疎通に向けて取り組んで行く所存です。 2020年の天文学に目を向けますと、ノーベル物理学賞がブラックホールの理論的・観測的研究に与えら

                                                                          国立天文台長 新年のご挨拶|国立天文台(NAOJ)
                                                                        • 【Apple】iPhone新型SEで見送られた機能と残念なポイント/会社員の僕が使う話題まとめ

                                                                          iPhone SE(アイフォーン エスイー) iPhone SE (第1世代) - 2016年にリリースされたオリジナルモデル。 iPhone SE (第2世代) - 2020年にリリースされたオリジナルモデル。 iPhone SE (第3世代) - 2022年にリリースされた新型モデル。 1 生玉子 ★ :2022/03/09(水) 21:44:43.18 Appleの「iPhone SE(第3世代)」が3月18日に発売される。先代「iPhone SE(第2世代)」とデザインは同じながら、iPhone 13シリーズと同じ「A15 Bionic」を搭載し、SEシリーズとしては初めて5Gに対応したことが大きなトピックだ。 ディスプレイとカメラはミッドレンジスマートフォンといえるスペックながら、プロセッサは最上位のものを搭載しており、5万円台からという価格を考えると、バランスの良いモデルにまと

                                                                            【Apple】iPhone新型SEで見送られた機能と残念なポイント/会社員の僕が使う話題まとめ
                                                                          • flask+ajaxでスライダーの値を読み取り動的になんやかんやする - Qiita

                                                                            やりたいこと flaskを使ってウェブアプリケーションを作成したい スライダー(<input type="range">)の値を読み取り、値に応じて要素をなんやかんや動的に変更したい その際ページ更新はしたくない(ajax通信で解決したい) 調べれば似たような記事はあるにはあるものの、勉強も兼ねて記事にすることにした。 やったこと flask + jQuery + ajaxで解決した。 今回なんやかんやに関しては、cv2.addWeighted()による画像合成を行うこととした。 今回のソースはすべて下記のリポジトリで公開しています。 https://github.com/ikentoh/flask-ajax スライダーを定義する 画像合成のアルファ値の単位はパーセンテージなので、0~100の値となるように設定する。 <div> <img src="{{ src_left }}"> <im

                                                                              flask+ajaxでスライダーの値を読み取り動的になんやかんやする - Qiita
                                                                            • 画像や写真を半透明で重ねる方法とおすすめアプリ3選

                                                                              画像(写真)を半透明で重ねるソフト・アプリおすすめ InstagramやTwitterなどのSNSで、よく半透明で重ねる画像(写真)を見つけることができます。ただ一枚の写真ではなく、他の綺麗な半透明の画像と合成すれば、高級感たっぷりで、人目を引くことができます。でも、そのような画像をどうやって作りますか。この記事では、画像を半透明で重ねるソフト・アプリを3本紹介したいと思います。 無料ダウンロード まとめて知りたい: テキスト音声変換・音声テキスト変換アプリおすすめ 動画にテキスト(テロップ)を入れるソフト・アプリおすすめ 証明写真を自分で作るやり方 手軽に写真をスタンプにするアプリおすすめ 画像半透明重ねるアプリ・ソフト透かし消去ソフト(Windows)透かし消去ソフトは動画と画像の透かし、テキスト、日付などの不要なものを消すことができるソフトであり、最新バージョンでは動画と画像に透かし

                                                                                画像や写真を半透明で重ねる方法とおすすめアプリ3選
                                                                              • 成功を目指すならiPhone SE 2ndを買おう!A13の高い処理能力が有効な時間を作り出す。小型スーパー効率化ツール | ハイパーガジェット通信

                                                                                成功を目指すならiPhone SE 2ndを買おう!A13の高い処理能力が有効な時間を作り出す。小型スーパー効率化ツール 2020 9/21 『大は小を兼ねる』という日本のことわざがありますが、スマートフォンに関して言えばそれは当てはまりません。ゲームをしたり動画を観る為に『大きい画面』を求めている人にとって『大きいスマートフォン』は『必要なもの』になります。しかし、『コミュニケーションツール』や『情報を調べて配信する為のツール』として使っており、出来るだけ持ち運ぶ荷物は減らしたい『スマート思考』な人からすると、『ポケットにすっぽり入るサイズ』というのはかなり重要です。 『スマート思考』な人は、出来るだけ物事を効率的に行いたいはず。『効率性』をスマートフォンに求めた時に、もっとも重要なのが『高い処理能力』です。スマートフォンは何か操作をする時に必ず『データの処理』を行っています。処理能力が

                                                                                  成功を目指すならiPhone SE 2ndを買おう!A13の高い処理能力が有効な時間を作り出す。小型スーパー効率化ツール | ハイパーガジェット通信
                                                                                • もはや人間では判別できない「ニセモノ」がAIによって生成されている世界。この世界を生きる僕たちが理解しておくべきこと

                                                                                  世の中はニセモノ(フェイク)で溢れています。 AI技術が発展したおかげで、ニセモノのクオリティも高くなってしまいました。 ・ディープフェイクのビデオや音声 ・AIが自動生成したテキスト、詩、歌詞 ・ニセモノのサイト ・ニセモノのインフルエンサー ・フェイクニュース ディープフェイクとは ディープフェイク(deepfake)は「深層学習(deep learning)」と「ニセモノ(fake)」を組み合わせた混成語(かばん語)で、人工知能にもとづく人物画像合成の技術を指す。「敵対的生成ネットワーク(GANs)」と呼ばれる機械学習技術を使用して、既存の画像と映像を、元となる画像または映像に重ね合わせて(スーパーインポーズ)、結合することで生成される。 既存と元の映像を結合することにより、実際には起こっていない出来事で行動している1人あるいは複数人の偽の映像が生み出されることとなる。 (Wikip

                                                                                    もはや人間では判別できない「ニセモノ」がAIによって生成されている世界。この世界を生きる僕たちが理解しておくべきこと