並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 522件

新着順 人気順

画像合成の検索結果41 - 80 件 / 522件

  • Amazon Lookout for Visionで青森認証やってみた - Qiita

    不良品検出のAIサービス「Amazon Lookout for Vision」が先週25日(木)に東京リージョンでの提供開始が発表されましたが、27日(土)には早くも「AWSの基礎を学ぼう」コミュニティのハンズオンが開催され、実際に体験してみることができました。 AI、機械学習系のハンズオンということで待ち時間なんかもあるわけですが、そこにソラコムの @ma2shita さんの「Amazon Lookout for Vision 向いてるコト、使いどころと注意点」とかJAWS-UG名古屋の @nori2takanori さんの「画像ベース異常検知Amazon Lookout for Visionを使ってみよう」とかLTが入って、退屈する暇のない2時間でした。その中で出てきたスライドの一枚がこちら。 Lookout for Visionは不良品検知にしか使えないサービスじゃないぞ、と。アイデ

      Amazon Lookout for Visionで青森認証やってみた - Qiita
    • "映え"おやつ写真を撮る方法

      愛知県出身、東京都在住のデザイナー。イラストを描き、写真撮影をして日々を過ごす。 最近は演劇の勉強に熱中。大きなエビフライが好き。 前の記事:浸し食べなら ムーンライトソフトケーキだ > 個人サイト 梅ログ かんたん「映え」の方法 おやつと、タブレットと、いい感じの画像。今回背景画像にはフリー素材を使用した。 やることは単純。いい感じの画像を全画面表示したタブレットに、よく見せたい物(おやつ)を置く。その状態をスマホで撮影する。 タブレット画面が明るすぎると逆光になってしまう。見栄えに影響するため、撮影前に調節しておく。 そうして撮影した画像に、画像加工アプリを使ってトリミングやフィルターといった加工を適宜施すだけ。 加工後の画像。レンガの背景がオシャレ〜。 タブレットの画面サイズに収まる大きさのおやつの撮影にちょうどいい。配置場所や構図を調整すれば、少し高さがある物も撮ることができる。

        "映え"おやつ写真を撮る方法
      • Goでheadless browserを用いた動的画像生成|Seiji Takahashi@ベースマキナ

        当ポストはGo Advent Calendar 2019の5日目の記事です。基本ポエムを書いていて技術記事を書く感覚が鈍っていますが頑張ります。 今回はGoでheadless browser(Chrome)を用いた、動的な画像生成を行うというテーマで書きたいと思います。 なぜ画像生成したいのか?人はなぜ画像を生成したくなるのでしょうか?僕は漫然と画像を生成するのは、時間に限りがある身としてはよくないな、と思います。ということで理由が必要なのですが、最たる例はOGP画像の生成とかじゃないでしょうか? あるいは任意のLGTM画像を生成したくて、文字を画像にかぶせたり、インスタグラムVer1.1みたいなサービスをローンチしたい時に、フィルター加工を実装したかったりするかもしれません。 Goで画像生成するには?Goで画像生成する方法に関してはこの1、2年でpo3rinさんや僕がしばしば登壇して解説

          Goでheadless browserを用いた動的画像生成|Seiji Takahashi@ベースマキナ
        • 手書きスケッチがリアルな髪形に イラストから髪形を自動生成するAI、香港の研究チームらが開発

          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 香港城市大学と香港中文大学、中国の浙江大学の研究チームが開発した「SketchHairSalon: Deep Sketch-based Hair Image Synthesis」は、プロではないユーザーがフリーハンドで描いたスケッチから、さまざまなヘアスタイルのフォトリアリスティックな髪の画像を自動生成する学習ベースのネットワークだ。 顔画像の上から手描きのストロークでスケッチすることで、好きな髪形を合成できる。リアルタイムに合成するため、画像上で髪形が変わっていく様子を見ながら描いていける。色や大きさの変更も自在に可能で、三つ編みなどのパーツもあらかじめ用意されており、選択して組み合わせ

            手書きスケッチがリアルな髪形に イラストから髪形を自動生成するAI、香港の研究チームらが開発
          • 今なら3,900円で手に入る!? MAGIXの高性能なWindows用ビデオ編集ソフト、Movie Studio 2022が発売開始|DTMステーション

            ドイツMAGIX社が開発したビデオ編集ソフト、Movie Studio 2022シリーズが3月15日、ソースネクストより発売されました。ビデオ編集をしたことがない初心者でも手早く簡単にビデオ編集できるのが売りで、高性能なビデオエンジンを搭載していることからサクサクとビデオ編集ができるのが特徴です。 下からMovie Studio 2022、Movie Studio 2022 Platinum、Movie Studio 2022 Suiteの3ラインナップがあり、一番下のMovie Studio 2022はパッケージ版でもダウンロード版でも4,950円と激安価格なのも嬉しいところ。しかも、3月28日までDTMステーションの読者限定で3,900円で購入できるクーポンが用意されています。8K/UHD映像の編集、出力にも対応し、DVD/Blu-rayの作成ができるのはもちろん、オーディオエフェクト

              今なら3,900円で手に入る!? MAGIXの高性能なWindows用ビデオ編集ソフト、Movie Studio 2022が発売開始|DTMステーション
            • Stability AI、画像にテキストを組み込める強力なテキストトゥイメージモデル「DeepFloyd IF」をリリース — Stability AI Japan

              定義とプロセス DeepFloyd IFは、モジュール化、カスケード化された、ピクセルdiffusion モデルです。ここでは、それぞれの記述子の定義を分解して説明します。 Modular: DeepFloyd IFは、複数のニューラルモジュール(テキストプロンプトからの画像生成やアップスケーリングなど、独立したタスクを解決できるニューラルネットワーク)で構成されており、1つのアーキテクチャでの相互作用により相乗効果が生まれます。 Cascaded: DeepFloyd IFは、異なる解像度で個別にトレーニングされた一連のモデルを使用して、カスケード方式で高解像度データをモデル化しています。このプロセスは、ユニークな低解像度サンプル(「プレーヤー」)を生成するベースモデルから始まり、連続する超解像度モデル(「アンプリファイア」)によってアップサンプリングされて、高解像度画像が生成されます。

                Stability AI、画像にテキストを組み込める強力なテキストトゥイメージモデル「DeepFloyd IF」をリリース — Stability AI Japan
              • ペラペラ曲がる紙に合わせて映像合成 NVIDIAなどが技術開発

                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 香港中文大学、中国浙江大学、米NVIDIAによる研究チームが開発した「LIFE: Lighting Invariant Flow Estimation」は、動画内の画像を別の画像や映像に変換できるオプティカルフロー推定(動く対象物の各画素がどの位置に移動したかを数値で表す各画素の移動量のこと)のための深層学習フレームワークだ。 カメラの視点や照明が大きく異なっても安定して画像を変換できる。また複雑に曲がる紙のような表面に対してもズレたり乱れたりせず、ぴったり貼り付いているかのような画像合成ができる。 動画内の一部分の対象だけ別の画像に変更し、カメラ視点が移動してもそれに応じて常に貼り付いて

                  ペラペラ曲がる紙に合わせて映像合成 NVIDIAなどが技術開発
                • Stable Diffusion TPU版の使い方 - 電通総研 テックブログ

                  電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusion(というよりdiffusers)でTPU(JAX / Flax)を使った並列実行バージョンがリリースされたので、早速試してみました。 オリジナルのNotebookはこちら。 僕が作ったNotebookはこちら。 今回は、TPUを使うので、Google Colabに特化しています。自分で1から試す方は、メニューのEdit -> Notebook settingsでTPUを使うように設定してください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す

                    Stable Diffusion TPU版の使い方 - 電通総研 テックブログ
                  • Affinity 2の新機能まとめ – Affinity Manual

                    この記事では、Affinity Designer 2、Affinity Photo 2、Affinity Publisher 2の新機能を日本語で解説している動画やツイート等をまとめています。 共通の新機能、Affinity Designer 2、Affinity Photo 2、Affinity Publisher 2、iPad特有の機能とカテゴリ分けしていますが、そのアプリにしかない機能ではなく「そのアプリでよく使いそうな機能」で分けているため、ほかのアプリでも利用できる機能もあります。 全部入りライセンスが登場 Windows版・Mac版・iPad版Affinity Designer、Affinity Photo、Affinity Publisherが全部使える「Affinity V2ユニバーサルライセンス」が登場。 PCでもiPadでも使いたい方、写真補正もデザインもしたい方、Ad

                    • iPhone11シリーズの「ナイトモード」で最高の写真を撮る、6つのコツ - iPhone Mania

                      iPhone11、iPhone11 Pro、iPhone11 Pro Maxでは、暗い状況でもきれいな写真が撮れるナイトモードが利用可能です。ナイトモードをフル活用するための6つのポイントをiDropNewsがまとめているので、ご紹介します。 高度な画像処理を簡単に使えるナイトモード iPhone11、iPhone11 Pro、iPhone11 Pro Maxで利用できるナイトモードは、ソフトウェアとA13 Bionicによる高度な画像合成と補正によって実現しています。 ナイトモードで撮影すると、カメラの光学式手ぶれ補正が作動し、ほぼ同時に複数枚の写真を撮影します。その後、ソフトウェアが写真を比較し、動きを補正してシャープに写った部分を融合、コントラスト・色を微調整してノイズを消し、ディテールを際立たせる、という処理がごく短時間に行われます。 しかし、ユーザーは難しいことを考えずに暗い場所

                        iPhone11シリーズの「ナイトモード」で最高の写真を撮る、6つのコツ - iPhone Mania
                      • Stable Diffusion入門-美少女を高確率で出す呪文 - 電通総研 テックブログ

                        電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、美少女を高確率で出す呪文です。 Stable Diffusionで人物を出力するときに、顔が崩れている、目が変、口がない、腕(手)が変などを経験した方は多いことでしょう。NSFW(職場や学校で閲覧注意)が連続で出て、心が折れそうになった方もいることでしょう。僕もそのうちの一人です。 今回は、クオリティの高い人物画を高確率で出力し、NSFWもほとんど起きない呪文を研究しました。 v2.1 美少女アニメ画もよろしければご覧ください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女

                          Stable Diffusion入門-美少女を高確率で出す呪文 - 電通総研 テックブログ
                        • AviUtlのフィルタ処理をGPU使用で高速化するプラグインが登場

                          1997年にリリースされた無料のフィルタリングツール「AviUtl」は、プラグインを導入することで高度な動画編集機能を獲得できるのが特徴です。そんなAviUltは基本的にCPUでフィルタ処理を行っているところを、GPUによる処理に切り替えるプラグインを導入することで処理を高速化することが可能です。 GPU化で処理を高速化するプラグインの1つが、柳氏の開発した「Boostプラグイン」です。 Aviutl Plugin 配布 Boost プラグイン : Aviutl研究所 https://aviutl.techblog.jp/archives/aviutl_plugin_boost.html 以下のムービーでBoostプラグインが解説されています。 Aviutl Plugin配布!AviutlをGPU動作化して超高速にするAviutl Boost! - ニコニコ動画 通常時だと65分44秒かか

                            AviUtlのフィルタ処理をGPU使用で高速化するプラグインが登場
                          • 物体を追加しても影や回り込みをリアルに合成する技術 ワシントン大学が開発

                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米ワシントン大学の研究チームが開発した「People as Scene Probes」は、一方向から撮影した映像の奥行きや光の当たり方を分析する深層学習ベースの技術だ。この技術を使うことで、影や「オクルージョン」(遮蔽物によって光の反射がさえぎられる度合い、環境遮蔽とも) を考慮したリアルな画像合成が可能になる。 映像内の物体から奥行き、オクルージョン、照明/影の情報を抽出し、新しく挿入する画像に適応することで自然な合成画像を生成するネットワークの概要図。下段の図では、手前の人物や奥の赤い車に対して適切な影が加えられている

                              物体を追加しても影や回り込みをリアルに合成する技術 ワシントン大学が開発
                            • 深層学習で着せ替えも簡単に 画像の一部だけを入れ替え合成する技術「SMIS」

                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国の華中科技大学と北京大学による研究チームが開発した「Semantically Multi-modal Image Synthesis」(SMIS)は、画像をオブジェクトごとにクラス分けし、部分的に画像を入れ替えて合成する深層学習ベースの手法だ。 画像のクラス分けには、ラベルを使って関連付けを行うセマンティックセグメンテーションを用いる。各画素に何が写っているのかを1つ1つ推定し、画像内で領域を分類しクラス分けする。 各クラスに応じたコントローラーで調整することで、対応する部分だけ画像を変換する。このような画像合成では従来、各クラスごとに生成ネットワークを構築し、異なるネットワークの出力

                                深層学習で着せ替えも簡単に 画像の一部だけを入れ替え合成する技術「SMIS」
                              • Stable Diffusion v1.5 美少女画検証 - 電通総研 テックブログ

                                電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、Stable Diffusion v1.5が出たので早速、Stable Diffusionが比較的苦手な美少女画で検証してみました。 StabilityAIではなく、Runawaymlからv1.5がリリースされたので、StabilityAIが削除申請を出したのですが、取り下げたようです。 huggingface.co Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文編 美少女アニメ画編 TPU版の使い方 美少女写真編 女性イ

                                  Stable Diffusion v1.5 美少女画検証 - 電通総研 テックブログ
                                • 【ツール】ちぎり絵風枠ジェネレータ【プレビュー版 v0.2】 - Little Strange Software

                                  どうも!LSSです!! の続編となります。 まだ、速度の方は改善されていないんですが^^;、とりあえず模様だけ増やしました。 前回同様の「ちぎり絵」の他、「ハート」「花びら」「星型」を選ぶ事ができます! このツールを用いて作成・ダウンロードされた画像はご自由にお使いいただけます^^ ちぎり絵風枠ジェネレータ やりたい事がたくさん出て来て追いつかないw ちぎり絵風枠ジェネレータ 幅 : 高さ : 内側の幅(比率) : % 内側の高さ(比率) : % 破片サイズ : 数 : 色味 : 破片の形状 : やりたい事がたくさん出て来て追いつかないw いただいた たくさんのコメントからもですし、自分で思いついたところも色々あります。 今回はとりあえず「模様 増やしてみました」Verですが、その増やした模様に角度をつけてみたいですね。 【ツール】アイキャッチ画像切り出しツール改! には「回転角」の設定が

                                    【ツール】ちぎり絵風枠ジェネレータ【プレビュー版 v0.2】 - Little Strange Software
                                  • NeRFによる360°パノラマ屋内シーンの任意視点画像合成 - spacelyのブログ

                                    はじめに スペースリーでインターンをしている大隣嵩です。 弊社は空間データ活用プラットフォームを提供しており、パノラマ画像を使った空間の3Dビューワーをリリースしました。 研究開発チームでは、更なる精度向上やコンテンツ制作負担軽減のため、より精度が高く柔軟な3D再構成技術の研究開発を進めています。 NeRF(Neural Radiance Fields)[1]では、写実的な陰影表現を含むシーンの高精度な3Dキャプチャを行うことができます。最近になって、NeRFを簡単に試すことができるアプリ(LumaAI[2])やフレームワーク(nerfstudio[3])が登場したことにより、研究者以外の人でも簡単にNeRFを試すことができるようになっています。今回は、屋内シーンの360度動画を使ってNeRF(nerfstudio)の精度検証を行った結果を紹介します。NeRFの概要については単眼からの3D

                                      NeRFによる360°パノラマ屋内シーンの任意視点画像合成 - spacelyのブログ
                                    • リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan

                                      ポイント SDXL Turboは、新しい蒸留技術によって最先端の性能を達成し、これまでにない品質のシングルステップ画像生成を可能にし、必要なステップ数を50から1に削減 非商用研究ライセンスでのリリース(Hugging Faceのモデルウェイトとコードをダウンロードしてください。) Clipdrop にてベータ版を公開中 新しいテキスト画像合成モードである SDXL Turbo をご紹介します。SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。技術的な詳細に興味のある研究者や愛好家のために、研究論文はこちらで

                                        リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan
                                      • [翻訳]AI生成コンテンツの総合調査:GANからChatGPTまでのGenerative AIの歴史|株式会社ガラパゴス

                                        原文の総文字数15万字超え!生成AI研究の歴史をまとめた論文をChatGPTを使って翻訳しました。ところどころ日本語がおかしいところもありますが、15万もの文字翻訳するのめんどくさい!という方、参考程度にご覧ください。ポイントだけ読み進めるとサクッと把握できます。 こちらの翻訳です 本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。 脚注、参考文献、Appendixなどは本文をご覧ください。 概要【POINT1】ChatGPTはAIGCのカテゴリに属し、効率的で高品質なコンテンツ作成をします。 【POINT2】大規模モデルの利用で、意図抽出や生成結果が向上し、現実に近いコンテンツが生まれます。 【POINT3】この調査では、生成モデルの進歩や未解決の問題・将来の課題について解説しています。 最近、ChatGPT は、DALL-E-2 [1]や

                                          [翻訳]AI生成コンテンツの総合調査:GANからChatGPTまでのGenerative AIの歴史|株式会社ガラパゴス
                                        • ブルース・ウィリスがディープフェイクを使って映画や広告で自身を使用する権利を売却

                                          「ダイ・ハード」シリーズや「アルマゲドン」、「シックス・センス」など数々の映画で活躍してきた俳優のブルース・ウィリスは、2022年3月に失語症を理由に俳優業を引退しました。そんなブルース・ウィリスが、「ディープフェイクを使って自身のデジタルツインを映画や広告に出演させる権利」を売却したことが明らかになりました。 Deepfake tech allows Bruce Willis to return to the screen without ever being on set https://www.telegraph.co.uk/world-news/2022/09/28/deepfake-tech-allows-bruce-willis-return-screen-without-ever/ A Bruce Willis deepfake will appear in his stea

                                            ブルース・ウィリスがディープフェイクを使って映画や広告で自身を使用する権利を売却
                                          • MonoSDFによる360°パノラマ屋内シーンのテクスチャ付きメッシュ復元 - spacelyのブログ

                                            はじめに スペースリーでインターンをしている大隣嵩です。弊社は空間データ活用プラットフォームとしてパノラマ画像を使った空間の3D化技術に関する研究開発を行っております。 最近では、iPhoneやAndroidで簡単に3Dスキャンができるアプリが登場しています。しかし、アプリを利用した3Dスキャンでは、低テクスチャな領域やスパースに撮影された領域の高精度な3D復元が難しいという課題があります。本記事では、単眼深度推定、法線推定結果をNeural Fieldsの追加の制約として学習させることで、一般的に復元が難しいとされる低テクスチャやスパースな画像群から高精度な3D復元を達成したMonoSDF[1]について紹介します。まずは、MonoSDFの概要を紹介し、その後、実験の結果を報告します。 MonoSDF: Exploring Monocular Geometric Cues for Neur

                                              MonoSDFによる360°パノラマ屋内シーンのテクスチャ付きメッシュ復元 - spacelyのブログ
                                            • 画像生成AI Stable Diffusion — Stability AI Japan

                                              日本文化を理解するために日本語入力を重視したテキスト画像生成モデル。従来の英語モデルよりも日本語表現を理解し、ネイティブ感のある高品質な画像生成が可能です。 JSDXL を試す コードをダウンロード モデルについて Stable Diffusion XLStable Diffusion XLは、画像生成機能を大幅に向上させ、画像合成と顔生成を強化することで、魅力的なビジュアルとリアルな美しさを実現します。

                                                画像生成AI Stable Diffusion — Stability AI Japan
                                              • Stable Diffusion入門-長い呪文は切り捨てられる - 電通総研 テックブログ

                                                電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、長い呪文は切り捨てられる編です。 からあげさんのStable Diffusionの内容を理解するための情報・書籍の記事の中に出てくる最初の75個分以降の文章は、バッサリ捨てられてしまう記事をみて、自分でも検証してみたのが今回の記事です。 これまで、意味のある区切りとして、カンマ(,)を使っていたのですが、カンマ(,)は75個のトークンの一つとして重複して数えられ、カンマ(,)を削っても出力結果はほとんど変わらないことを知って愕然としました。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1

                                                  Stable Diffusion入門-長い呪文は切り捨てられる - 電通総研 テックブログ
                                                • Adventure game graphics with DALL-E 2 - Et tu, Cthulhu

                                                  I recently got access to OpenAI's DALL-E 2 instance. It's a lot of fun, but beyond its obvious application as a cornucopia of funny cat avatars, I think it's now fit to use in certain kinds of creative work. There are already plenty of good articles out there on the model's strengths and weaknesses, so I won't go over that here other than to note that it's not a threat to high-end art. It's got an

                                                    Adventure game graphics with DALL-E 2 - Et tu, Cthulhu
                                                  • 西川善司の3DGE:技術の視点で分析するPSVR2の体験。進化した映像表現や操作感からグラフィックス表現のポイントまでまとめて解説

                                                    西川善司の3DGE:技術の視点で分析するPSVR2の体験。進化した映像表現や操作感からグラフィックス表現のポイントまでまとめて解説 ライター:西川善司 ソニー・インタラクティブエンタテインメント(以下,SIE)が2023年初頭の発売を目指して開発中のVRヘッドマウントディスプレイ(以下,VR HMD)「PlayStation VR2」(以下,PSVR2)。東京ゲームショウ2022で行われた「バイオハザード ヴィレッジ」による体験デモも非常に好評だったようで,一般公開日には数時間待ちの行列ができたという。 筆者は事前に,PSVR2の報道関係者向け体験会に参加できたので,本稿では,そのときに気付いたPSVR2の所感についてまとめてみたい。 ただし,あらかじめSIEから,「西川さん,今日はPSVR2のハードウェア周りに関する質問は,一切ダメですよ」と釘を刺されてしまったため,細かい話を聞くことは

                                                      西川善司の3DGE:技術の視点で分析するPSVR2の体験。進化した映像表現や操作感からグラフィックス表現のポイントまでまとめて解説
                                                    • Anthropic Claudeで英訳したテキストをもとにStability AI Stable Diffusion XL(SDXL)で画像を生成するAmazon Bedrockの使用例 - NRIネットコムBlog

                                                      小西秀和です。 以前の記事でAmazon Bedrockの参考資料、モデル一覧、価格、使い方、トークンやパラメータの用語説明、Runtime APIの実行例について紹介しました。 Amazon Bedrockの基本情報とRuntime APIの実行例まとめ - 参考資料、モデルの特徴、価格、使用方法、トークンと推論パラメータの説明 今回はAnthropic Claudeで英訳したテキストをもとにStability AI Stable Diffusion XL(SDXL)で画像を生成するAmazon Bedrockの使用例を紹介します。 ※本記事および当執筆者のその他の記事で掲載されているソースコードは自主研究活動の一貫として作成したものであり、動作を保証するものではありません。使用する場合は自己責任でお願い致します。また、予告なく修正することもありますのでご了承ください。 ※本記事執筆にあ

                                                        Anthropic Claudeで英訳したテキストをもとにStability AI Stable Diffusion XL(SDXL)で画像を生成するAmazon Bedrockの使用例 - NRIネットコムBlog
                                                      • 【GitHub Copilot】今更ながら入門してみた! - Qiita

                                                        GitHub Copilotは現在30日間フリートライアルを行っています。 (以前は60日だったような......) ずっと気になっていたので、GW中にtrialで使い倒してみようと思い入門してみます。 結論を先に書くと、素晴らしいツール! だけど新人/駆け出しで扱う場合は注意が必要 といった感想でした。 まだお試ししていない方は、本記事で私と一緒にtrial登録していきましょう! 本記事が少しでも読者様の学びに繋がれば幸いです! 「いいね」をしていただけると今後の励みになるので、是非お願いします! 環境 Ubuntu22.04 Python3.11.1 事前準備 GitHubアカウントの作成。 まだの方は「GitHubにSign Up」 導入 以下の手順でGitHub Copilotに登録します。 「GitHub Copilot」にアクセスしてStart my free trialをクリ

                                                          【GitHub Copilot】今更ながら入門してみた! - Qiita
                                                        • 宇宙ニュースなど(訂正あり) - Rioでじゃねーど

                                                          Rioでじゃねーど、でっす。 季節の変わり目ですが、みなさんお元気ですか? んーと・・・ はい、それでは最近の宇宙ニュースを簡単にまとめようと思います。(普通のことを書くって、宇宙のこと書くより難しい~O O;) 【延期】『こうのとり』HⅡBロケット8号機の打ち上げは? 先週、火災のため打ち上げが延期された『こうのとり』HⅡBロケット8号機は、来週24日に打ち上げる方向で、調整に入ったとのことです。 (id:fic-tion)フィクーションさん、(id:hukunekox)Pちゃん (id:hannah826)はんなさんIDコールで失礼します。 ロケット打ち上げが再度延期します。 延期は今後も続く可能性があります。 最新の情報をここに載せますので、ご確認ください。 今のところ、今夜の夜中ではなく明日の夜になります。 打ち上げは9月25日(水)午前1時5分です。 打ち上げ中継は前回と同じ、こ

                                                            宇宙ニュースなど(訂正あり) - Rioでじゃねーど
                                                          • 【画像編集】スマホだけで色んな写真をアレンジ!!?【サムネイル】【アプリ3選】 - Mr.しょーん

                                                            どうもみなさん。 無人島に2つ何かを持って行くとしたら 何を持って行きますか? ナイフ?カガミ? いやいやもう時代は令和ですよ。 スマホと画像編集力でしょ (´・Д・)」 今じゃSNSや様々なメディアを 個人がお持ちの時代なのです。 無人島で撮った写真をあーら素敵にアレンジ!!! それを簡単SNSにアップするだけ♫ こんな素敵な逸材を危険な無人島に残せないわ!!! ということで誰かが助けに来てくれるでしょうwww ざわざわ... ざわざわ... ※どーも闇しょーんです 危険な無人島であると書きましたが 果たして無人島で生き残ることは 有人の土地で生きるよりも危険なのでしょうか もののけ姫でも人間が森を壊したと言っていました。 安全な世界とは一体... ( ゚д゚)はっ!!!!? ナニガオコッタンダ!!!? ということで茶番はこれくらいにして スマホだけでできる画像編集のやり方ですw 自分流

                                                              【画像編集】スマホだけで色んな写真をアレンジ!!?【サムネイル】【アプリ3選】 - Mr.しょーん
                                                            • Google、文章から画像を生成するAI「Imagen」 「DALL-E 2より好まれる」

                                                              拡散モデル(Diffusion Model)は、ランダムなドットのパターンから始まり、画像の特定の側面を認識すると、そのパターンを画像に向かって徐々に変更するモデルとGoogleは説明する。Imagenは、文章を理解するための大規模な変換言語モデルをベースに拡散モデルで画像を生成する。 Imagen開発の過程で、テキストデータのみでトレーニングした汎用の大規模言語モデルが画像合成のためのテキストエンコードに非常に効果的だということが分かったという。Imagenで言語モデルのサイズを大きくすると、画像拡散モデルのサイズを大きくするよりも結果がはるかに向上するとしている(詳細は論文)。 GoogleはImagenを「現時点では公共の使用には適していない」と判断し、一般に公開はしないとしている。フェイクニュースやリベンジポルノに容易に悪用できそうなツールだからだ。また、変換モデルのデータはキュレ

                                                                Google、文章から画像を生成するAI「Imagen」 「DALL-E 2より好まれる」
                                                              • 1枚の顔写真から過去や未来の姿を生成 各年齢のしわや頭部をAIが予測

                                                                これは、事前学習したStyleGANの画像生成と、エンコーダーをペアにしたエンド・ツー・エンドの画像間変換アーキテクチャで加齢をシミュレートする。1枚の人物画像と希望する年齢を、StyleGANの潜在空間にマッピングするために直接エンコードすることで、高品質な画像合成を生成するStyleGANの表現力を享受している。 年齢を他の顔の属性(表情や髪形など)から切り離した分離方法でモデルを学習しているため、元のアイデンティティーを損なうことなく、シワなどの質感から頭部の形まで精密な合成を生成する。 入力の年齢から希望する年齢への変化を回帰タスクで生成しているため、これまでのように大きく分けた年齢クラス(例えば、0~2、3~6、7~9、15~19、30~39、50~69歳)で顔を生成するのではなく、1歳ごとのより細かい年齢クラスでの制御を可能にした。動画では、年齢によって変化する顔画像のモーフィ

                                                                  1枚の顔写真から過去や未来の姿を生成 各年齢のしわや頭部をAIが予測
                                                                • Stable Diffusion入門-人物写真 - 電通総研 テックブログ

                                                                  電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 これから、Stable Diffusionについてシリーズで書いていきたいと思います。 基本的な方針は、Promptの仕組みを体系的に理解することです。元ネタとしては、DALL·E 2 Prompt Bookを使います。 DALL·E 2 Prompt Bookの内容を試し、僕なりに消化したことを説明していきたいと思います。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文編 美少女アニメ画編 美少女写真編 女性イラスト編 魅惑的な女アニメ画(トゥーンレンダリング)編 長い

                                                                    Stable Diffusion入門-人物写真 - 電通総研 テックブログ
                                                                  • バービーと原爆の画像合成で騒動に…核兵器への日米の温度差を「バーベンハイマー」の流行から考える:東京新聞 TOKYO Web

                                                                    原爆投下後を思わせる背景の中、バービー役の俳優がオッペンハイマー役の肩に乗り、笑顔ではしゃぐ合成画像(Xよりスクリーンショット) 広島と長崎への原爆投下から今年で78年がたつ。犠牲者を悼み、平和を願う式典が開かれるこの時期に、被爆者らの気持ちを逆なでする出来事が起きた。映画「バービー」の米国のX(旧ツイッター)公式アカウントが、原爆投下を想起させる画像に好意的な反応をしたのだ。原爆投下に対する日米の認識の差というだけで終わらせていい問題だろうか。(曽田晋太郎、西田直晃)

                                                                      バービーと原爆の画像合成で騒動に…核兵器への日米の温度差を「バーベンハイマー」の流行から考える:東京新聞 TOKYO Web
                                                                    • 【保存版】さまざまなAI画像処理の手法を学べるレシピ50選(2022年8月版) - Qiita

                                                                      はじめに ※本記事は2022年8月16日に20個のレシピを追加し50選へと更新いたしました。 AxrossRecipeを運営している松田です。 AxrossRecipe は、エンジニアの"アカデミックな教育"と"現場の業務"のスキルギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによるノウハウが"レシピ"として教材化されており、動くものを作りながらAI開発やデータ分析の流れを追体験できます。 AxrossRecipe: https://axross-recipe.com Twitter: https://twitter.com/AxrossRecipe_SB 画像処理とは 画像処理は、「動画像のデータに対して、コンピュータが何かしらの処理を施すこと」の総称で、「画像認識」や「物体検出」、「画像合成・加

                                                                        【保存版】さまざまなAI画像処理の手法を学べるレシピ50選(2022年8月版) - Qiita
                                                                      • Stable Diffusion - Wikipedia

                                                                        Stable Diffusion(ステイブル・ディフュージョン)は、2022年に公開されたディープラーニング(深層学習)のtext-to-imageモデル(英語版)である。主にテキスト入力に基づく画像生成(text-to-image)に使用されるが、他にもインペインティング(英語版)(英: inpainting)、アウトペインティング(英: outpainting)、テキストプロンプトによって誘導される画像に基づく画像生成(image-to-image)にも使用される[3]。 Stable Diffusionは、ミュンヘン大学のCompVisグループが開発した潜在拡散モデル(英: latent diffusion model)であり、深層生成ニューラルネットワーク(英: deep generative neural network)の一種である[4]。このモデルは、EleutherAIとL

                                                                          Stable Diffusion - Wikipedia
                                                                        • Stable Diffusion入門-画像タイプ - 電通総研 テックブログ

                                                                          電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回のテーマは、画像タイプ。色々な画像を見ていくよ。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文編 美少女アニメ画編 美少女写真編 女性イラスト編 魅惑的な女アニメ画(トゥーンレンダリング)編 長い呪文は切り捨てられる編 a ball-point pen art a pencil sketch 3D photorealistic pencil drawing a crayon painting an acrylic paint

                                                                            Stable Diffusion入門-画像タイプ - 電通総研 テックブログ
                                                                          • やっぱりWasm は C++!!!~Wasm/EmscriptenでOpenCVを使う~

                                                                            はじめに質問 Wasm は何で書く?Go? Rust? AssembyScript? やっぱりWasm は C++!!!~Wasm/EmscriptenでOpenCVを使う~ ※現状での個人の見解です。 ということで、Emscripten で OpenCV を扱うことについて記事です。 この記事の元ネタはWebAssembly Night #10の発表内容です。 そしてOpenCV Advent Calendar 2020 の 9 日目でもあります。 画像処理 on your Browserの時代 Wasm といえば最近はすっかり Go や Rust で書くことが盛り上がっていますが、まだまだ C++/Emscripten も活躍しどころがあります。ブラウザでのクライアント画像処理が代表的なものでしょう。 WebRTCインフラの充実 時雨堂 WebRTC SFU Sora/NTT Com.

                                                                              やっぱりWasm は C++!!!~Wasm/EmscriptenでOpenCVを使う~
                                                                            • 画像生成AI「Stable Diffusion」を使って任意のテキストに沿ったカラーパレットを生成するツールをアーティストが開発

                                                                              イギリス・ロンドンを拠点に活動するアーティストのMatt DesLauriers氏が、「美しい夕日」や「東京のネオン」といった任意のテキストを入力すると、そのイメージに当てはまるようなカラーパレットを生成することができるツールを開発しました。 Artist uses AI to extract color palettes from text descriptions | Ars Technica https://arstechnica.com/information-technology/2022/09/artist-uses-ai-to-extract-color-palettes-from-text-descriptions/ DesLauriers氏は画像生成AIの「Stable Diffusion」を用いて、任意のテキストプロンプトに沿ったカラーパレットを作成することができるツー

                                                                                画像生成AI「Stable Diffusion」を使って任意のテキストに沿ったカラーパレットを生成するツールをアーティストが開発
                                                                              • 「令和元年9月 保管追加」映画とゲームと音楽 - #楽活!収入増やして人生を楽しく!

                                                                                映画 「THIS IS IT」 2009年  アメリカ 主演 マイケル・ジャクソン キング・オブ・ポップがここに詰まっている。少ない観客の向こうに大勢のファンが見える。自分もそのひとつになったような気がした。 「探偵はBARにいる3」 2017年 日本 主演・出演 大泉洋 松田龍平 北川景子 コメディカルとハードボイルドのバランスがとれている。相棒の松田龍平の役割がより明確になっていて、大泉洋の負けっぷりもカッコよさも見事に引き出していた。セリフもテーマもしっかりしていて、いい作品でした。 「万引き家族」 2018年 日本 主演・出演 リリー・フランキー 安藤サクラ 樹木希林 ふむむと考えさせられる作品。子供3人は何を思ったのか。 「億男」 2018年 日本 主演・出演 佐藤健 高橋一生 お金の見方が変わる。小説通りの終わり方でした。 「コーヒーが冷めないうちに」 2018年 日本 主演・

                                                                                  「令和元年9月 保管追加」映画とゲームと音楽 - #楽活!収入増やして人生を楽しく!
                                                                                • 複数画像レイヤー同時生成できるAI「LayerDiffuse」、MML対応音楽生成AI「ChatMusician」、高性能なリップシンクAI「EMO」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                                                  2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第36回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 透明画像含む複数のレイヤーをテキスト指示で同時に生成するAI「LayerDiffuse」 1枚の顔写真と音声から、喋って歌う頭部動画を生成するモデル「EMO」、アリババが開発 大規模言語モデルの計算コストを大幅に軽減する1ビットLLM「BitNet 1.58Bits」をマイクロソフトが開発 音楽をテキストのように扱い、音楽の理解と生成を行うAI「ChatMusician」 複数のLoRAを適応する画像合成法「Multi-LoRA」 透明画像含む複数のレイヤーをテキスト指示で同時に生成する

                                                                                    複数画像レイヤー同時生成できるAI「LayerDiffuse」、MML対応音楽生成AI「ChatMusician」、高性能なリップシンクAI「EMO」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge