並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 524件

新着順 人気順

画像合成の検索結果121 - 160 件 / 524件

  • 【保存版】さまざまなAI画像処理の手法を学べるレシピ50選(2022年8月版) - Qiita

    はじめに ※本記事は2022年8月16日に20個のレシピを追加し50選へと更新いたしました。 AxrossRecipeを運営している松田です。 AxrossRecipe は、エンジニアの"アカデミックな教育"と"現場の業務"のスキルギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによるノウハウが"レシピ"として教材化されており、動くものを作りながらAI開発やデータ分析の流れを追体験できます。 AxrossRecipe: https://axross-recipe.com Twitter: https://twitter.com/AxrossRecipe_SB 画像処理とは 画像処理は、「動画像のデータに対して、コンピュータが何かしらの処理を施すこと」の総称で、「画像認識」や「物体検出」、「画像合成・加

      【保存版】さまざまなAI画像処理の手法を学べるレシピ50選(2022年8月版) - Qiita
    • Stable Diffusion 2.1-美少女アニメ画 - 電通総研 テックブログ

      電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、Stable Diffusion 2.1-美少女アニメ画です。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文 美少女アニメ画 美少女写真 女性イラスト 長い呪文は切り捨てられる AUTOMATIC1111のインストール AUTOMATIC1111のセッティング 美少女アニメ画の呪文 通常呪文の解説 masterpiece high quality highly detailed (kawaii princess:1.2)

        Stable Diffusion 2.1-美少女アニメ画 - 電通総研 テックブログ
      • 画像合成革命!LayerDiffusionで画像生成が活用フェーズに

        LayerDiffusion技術が実現する透過画像生成の新時代に注目。AIを用いて透明度を精密にコントロールし、革新的な画像生成の地平を拓く。クリエイティブな可能性が広がります。 それだけでも十分にスゴイです。 しかし、LayerDiffusionにはさらにスゴイ機能が備わっています。 現時点において、全部で6個のMethodから選択できます。 今回は、「Background Condition」に属する以下の二つのMethodについて説明します。 From Background to BlendingFrom Background and Blending to Foreground From Background to Blending 日本語にすると「背景からブレンドへ」という表現になります。 これだけでは意味がわかりません。 言葉よりも、実際に見た方が早いです。 まず、次のような背

          画像合成革命!LayerDiffusionで画像生成が活用フェーズに
        • Power Automate の HTTPアクションで multipart/form-data でデータを送る場合の備忘録 - MoreBeerMorePower

          Cloudmersive の APIドキュメントを読んでいたら Power Automate のコネクターにはないAPIがあったので試してみようと思ったら、意外と面倒だったので備忘録。 Cloudmersiveの画像合成APIはファイルを2つformDataで送るが・・・ API Consoleでどんなデータを送ればいいのか見てみると、formDataで、2つの画像ファイルを送る必要があるということでした。いつも通りPostmanで試してみたところ、非常にすんなりいったんです。form-dataでKeyとValue (この場合はファイル) を選択できるので。 じゃあ、Power Automateで~と思ったのですが、ここでいきなり躓きました。 どうやってファイルをform-dataで送ればいいのか! bodyをどう書くか まずは「作成 (Compose)」アクション2つでファイル2つを定義

            Power Automate の HTTPアクションで multipart/form-data でデータを送る場合の備忘録 - MoreBeerMorePower
          • グラフで見る生成AIの勢い 従業員数1年で8倍の企業も - 日本経済新聞

            米オープンAIを筆頭に生成AI(人工知能)スタートアップへ投資マネーが集中している。こうした企業への投資額は2023年上半期だけで22年通年の5倍以上に増え、ユニコーン(企業価値10億ドル以上の未上場企業)の数は18社になった。生成AIはどんな方向に行こうとしているのか。この業界の今後を占うため、応用分野別の投資動向など7つのグラフを使ってCBインサイツが分析した。プログラムから画像、合成音声ま

              グラフで見る生成AIの勢い 従業員数1年で8倍の企業も - 日本経済新聞
            • 最近読んだ技術書 - かずひらの日記

              フロントエンド→サーバーサイド開発に移ったことが濃く反映されたラインナップ Node.jsデザインパターン 第2版 「5章 ストリーム」の終わりまで。 仕事で画像合成サーバーを触っていて、Node.js ( CoffeeScript )で実装されている。なんか最近開発チームで各メンバー専門領域を持ちましょう、それに伴って「xxx大臣」を名乗りましょうというムーヴメントがあって、面白そうだなと思ってた画像合成サーバーの大臣になった。 画像の合成はヘビーな処理なので、可能な限りStreamで扱うようになってる。一方で自分のStreamについての理解は「なんか流れていくアレ」という感じで、そういえばStreamとBufferの違いがよく分かってなくて、大臣なのにヤバいと思って読んだ。 この本については過去にブログで言及した記憶があって、検索してみたらちょうど2年前だった。懐かしい。 Node.j

                最近読んだ技術書 - かずひらの日記
              • 新たな恒星間天体か? - 太陽系外から接近中の彗星「C/2019 Q4」発見

                2017年に世界を沸かせた「オウムアムア」に続く、観測史上2つ目の恒星間天体が発見されたかもしれない。 2019年8月30日にアマチュア天文家によって発見された天体「C/2019 Q4」が、その後の分析で、太陽系外から飛来する軌道を飛んでいる可能性が高くなった。さらに、彗星に似た特性をもっていることも判明した。 もし正式に確認されれば、2017年10月に飛来した「オウムアムア」に続く、観測史上2つ目の恒星間天体であり、また観測史上初の恒星間彗星となる。 2019年9月10日に、ハワイにあるカナダ・フランス・ハワイ望遠鏡で撮影されたC/2019 Q4 (C) Canada-France-Hawaii Telescope C/2019 Q4は8月30日、クリミア半島にあるクリミア天体物理天文台のMARGO天文台において、ウクライナのアマチュア天文家ゲナディ・ボリソフ(Gennady Boris

                  新たな恒星間天体か? - 太陽系外から接近中の彗星「C/2019 Q4」発見
                • TIPS、お役立ち情報:StableDiffusion WaifuDiffusion、NovelAI プロンプト関連

                  高松アポロ @Apollo_Takamatu NovelAIの便利機能~~~~~ プロンプト模索中に前のヤツの方がよかったな……って思ったらCtrlキー押しながらHistoryの画像クリックで呪文、画像サイズ、スケール等同じ条件が出せるぞ! 2022-11-02 06:42:24 高松アポロ @Apollo_Takamatu Ctrl+Enterでプロンプト入力欄折り返しは有名だけど、Ctrl+Shift+Enterで入力欄を増やせる 増えた入力欄は追加で入力出来る枠ではなくて元々の入力欄に合成される かなり強力な合成なので絵が破綻するパターン多め ←元画像 合成欄にa catを入力→ twitter.com/Apollo_Takamat… pic.twitter.com/KbjESscE68 2022-11-02 06:53:59

                    TIPS、お役立ち情報:StableDiffusion WaifuDiffusion、NovelAI プロンプト関連
                  • リコー、360度の全天球撮影ができるRICOH THETAにエントリーモデル--「SC2」

                    リコーとリコーイメージングは11月19日、ワンショットで360度の静止画や動画を撮影できる360度カメラ「RICOH THETA」シリーズのエントリーモデルとして、「RICOH THETA SC2」を12月13日に発売すると発表した。市場想定価格は、3万6800円(税込)。 RICOH THETA SC2は、簡単な操作で誰でも手軽に高品質な全天球イメージが撮影できる「RICOH THETA」シリーズのエントリーモデル。 明るい開放F値2.0の大口径小型二眼屈曲光学系と最新のイメージセンサーにより、約1400万画素に相当する360度の全天球静止画が得られるほか、4K(3840×1920ピクセル)相当、30fps(フレーム/秒)の滑らかで臨場感あふれる360度の全天球動画撮影にも対応した。 Bluetoothによるスマートフォンとの常時接続が可能となり、Bluetoothのみによる接続時でもス

                      リコー、360度の全天球撮影ができるRICOH THETAにエントリーモデル--「SC2」
                    • Waifu Diffusion 1.3.5_80000 - 電通総研 テックブログ

                      電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回のテーマは、Waifu Diffusion 1.3.5_80000です。 Waifu Diffusionというのは、Stable Diffusionから派生していて、美少女アニメ画に強いという特徴を持っています。 80000というのは、学習の度合いを表していて、「まだ完成してないけど、みんなの反応を見たい」ということで、プレビューとしてリリースされたんだと思います。 Hugging Face上のページは、こちら。 バージョンが1.4になっているので、学習が進んで完成すると、1.3.5が1.4になるんでしょうね。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画

                        Waifu Diffusion 1.3.5_80000 - 電通総研 テックブログ
                      • グーグル、AIで複雑な写真編集が簡単にできる「Magic Editor」発表

                        「Google I/O」は、Googleが1年分の技術革新を披露したりさまざまな発表を行ったりする場だ。人工知能(AI)を新たな形で取り入れた新機能「Magic Editor」もその1つで、2023年内に「Googleフォト」に導入される。 Googleの最高経営責任者(CEO)Sundar Pichai氏がGoogle I/Oで明らかにしたところによると、Googleフォトでは現時点で1カ月に17億枚の画像が編集されているという。写真から不要な人や物を取り除いてくれる「消しゴムマジック」はすでに利用できるが、Magic Editorではそれに加えて、AIを使った複雑な編集が可能になるため、ユーザーは個別の写真編集アプリを利用する必要がなくなる。 Magic Editorでは、生成AIツールを他のAI技術と組み合わせて使うことで、簡単に画像の編集ができる。例えば、被写体や物体を選んで写真内

                          グーグル、AIで複雑な写真編集が簡単にできる「Magic Editor」発表
                        • AI絵師にとって鮭は切り身? | スラド IT

                          AIによる画像合成がブーム化しているが、今から製本がんばれ、八汰さんのツイートによると、AIに鮭を描かせるとどうしても切り身化してしまう現象が起きてしまうという。同氏の上げた写真では鮭の切り身が悠々と川を泳いでいる姿が生成されている。Twitterの指摘では昔からメディアなどで「最近の子はスーパーで切り身しか見てないから云々」とかいう話もあったがAIがそれを具現化したとし、AIは現代っ子であるとの指摘も出ているようだ(今から製本がんばれ、八汰さんのツイート、Togetter)。

                          • 1100万回視聴されたトム・クルーズの動画はディープフェイクだった

                            AI(人工知能)が人物動画を合成するディープフェイク。この技術を使ったトム・クルーズの動画が世界を騒がせている。CNNをはじめとした複数の海外メディアが報じている。 謎のTikTokアカウント「ディープトムクルーズ」 動画は2月22日からの数日間にTikTokに投稿されたもの。全部で3本しかなく、どれにも偽のトム・クルーズが映っている。 TikTokはディープフェイク動画の投稿を禁止しているため、現在はどれも閲覧できなくなっているが、3月2日の時点でこれらは1100万回以上視聴されていた。投稿者については、deeptomcruise(ディープトムクルーズ)というアカウント名以外何も分かっていない。 どんな動画か? 現在はツイッターに拡散されているので、そちらをご紹介しよう。 まずはゴルフのスイングを披露する偽トム。カメラに向かって「TikTokのみんな、何してる? 僕がスポーツをやるとした

                              1100万回視聴されたトム・クルーズの動画はディープフェイクだった
                            • [Stable Diffusion] AIでテキストと画像から新たな画像を生成する [img2img]

                              [Stable Diffusion] AIでテキストと画像から新たな画像を生成する [img2img] 2022年8月27日土曜日 Artificial Intelligence 本記事では、機械学習手法Stable Diffusionを用いてテキストと画像から新たな画像を生成するimg2imgを実行する方法をご紹介します。 Stable Diffusion 概要 Stable Diffusionは、拡散モデルによる画像合成モデルです。 自然言語で入力されたテキスト(prompt)から画像を生成するText to Imageタスクを実現します。 Latent Diffusionをベースとした本モデルは、非常に大規模なデータセットであるLAION-5Bを用いてトレーニングされています。 GoogleのImagenやOpenAIのGLIDE, DALLE-2など最新の画像生成モデルは社会に与え

                                [Stable Diffusion] AIでテキストと画像から新たな画像を生成する [img2img]
                              • サムネイル画像生成システムのこだわりを語らせろ。 - Qiita

                                本題の前に この記事は、ジーズアカデミーのカレンダー | Advent Calendar 2022 - Qiita 10日目です。 昨日の記事は taisuke-m さんによる 学校教育とICT(40代普通の教員の思うこと)でした。 教育現場でのIT導入の課題と、そんな課題意識を持ったからこそG's ACADEMY に入学した経緯など、アツい内容でしたね! 今回語りたいこと 自己紹介します! どーも皆様、こんにちは!どんぶラッコこと、TOKYO LAB6期 卒業の 坂尻愛明です。 私たちは今、「作品の想いと世界を結ぶ」をコンセプトにしたサービス、AnyPaletteを運営しています。 AnyPaletteとは、クリエイターが描いた作品をインテリア商品として販売できるマーケットプレイスです。 2022年12月現在、150名ほどのクリエイター様にご登録をいただいており、素敵な作品がたくさん出品

                                  サムネイル画像生成システムのこだわりを語らせろ。 - Qiita
                                • 風景写真撮影テクニック ~露出ブラケット編~|齋藤朱門 | ShaSha

                                  はじめに 今回は風景写真撮影を楽しむ上で知っておくと役に立つ基本的な撮影テクニックの一つである、露出ブラケット撮影の撮影方法と撮影後のRAW現像処理の方法を紹介したいと思います。 輝度差の大きいシーンでの撮影 風景撮影といっても、シーンによってその撮影方法はさまざまですが、特に太陽を逆光で捉えるような輝度差が大きいシーンでは、ダイナミックレンジが広いフルサイズや中判のカメラを使っていたとしても、そのままでは1枚で捉えきれない場合があります。 こちらは雪原での枯れ木と夕日を撮影した作例です。 ■撮影機材:FUJIFILM GFX100S + GF45-100mmF4 R LM OIS WR ■撮影環境:マニュアル露出(露出ブラケット撮影)・52.9mm・F18・ISO100・1/200秒 こういった輝度差が大きなシーンでも白飛びや黒潰れを極力抑えながら、自然に見たまま風景を撮影するための撮影

                                    風景写真撮影テクニック ~露出ブラケット編~|齋藤朱門 | ShaSha
                                  • フォトリアリズムをAIが追求、Stability AIがAPIおよびStable Diffusion XLベータ版を発表 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                    画像:Stable Diffusion 本日、昨年8月にオープンソースの画像生成ツール「Stable Diffusion」で世間の想像力をかき立てたジェネレーティブAI企業「Stability AI」は、企業顧客向けに「フォトリアリズムを得意とする」という最新の画像生成モデルStable Diffusion XL(SDXL)のベータリリースを発表した。 「SDXLは、グラフィックデザインや建築など、いくつかの業界において変革をもたらす豊かな画像生成を実現する」と、Stability AI CTOのTom Mason氏はプレスリリースでコメントしている。 SDXL ベータ版は、エンタープライズ開発者を対象としたStabilityのAPIと DreamStudioプログラミングスイートで利用可能だ。SDXLは、前身のStable Diffusion 2.1よりも、次レベルのフォトリアリズム、画

                                      フォトリアリズムをAIが追求、Stability AIがAPIおよびStable Diffusion XLベータ版を発表 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                    • MIT、環境にやさしいAIモデルを論文で発表 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                      Photo by Marcin Jozwiak on Pexels.com MITは最新の論文にて、既存アプローチに比べさらに環境保全に適したAIモデルのトレーニングシステムについて発表した。同論文によれば、モデリングにおける計算効率を向上させることで二酸化炭素の排出を3桁近く抑えられるとする。 AIを利用したモデリングは、例えば画像合成・タンパク質モデリング、自動運転等の分野で多岐に渡り活用されているが、それらの持続的可能性については疑問符が生まれてきている。昨年6月に、マサチューセッツ大学アマースト校の研究員は、あるモデリングに対して必要な電力量は自動車が排出する米国平均CO2のや約5倍に相当する62万6000ポンドを排出するとのレポートを報告している。 論文で主張される「Once-for-all」ネットワークは、様々なプラットフォームごとに調整可能な多数のサブモデルで構成される事前訓

                                        MIT、環境にやさしいAIモデルを論文で発表 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                      • aipicasso/cool-japan-diffusion-for-learning-2-0 · Hugging Face

                                        Cool Japan Diffusion for learning 2.0 Model Card 注意事项。从2023年1月10日起,中国将对图像生成的人工智能实施法律限制。 (中国国内にいる人への警告) This model is released for Japanese people mainly. Therefore, the documents of the model are written in Japanese. The documents will be translated into English for the foreign countries after I obtain the consensus from Japanese people. Thank you for your cooperations. (日本語が読めない人へのお願い) はじめに 学習用Co

                                          aipicasso/cool-japan-diffusion-for-learning-2-0 · Hugging Face
                                        • [Stable Diffusion] AIで指定範囲をテキストで指示して画像修復 [inpainting]

                                          [Stable Diffusion] AIで指定範囲をテキストで指示して画像修復 [inpainting] 2022年8月30日火曜日 Artificial Intelligence 本記事では、機械学習手法Stable Diffusionを用いて画像の特定の範囲をテキストに応じた画像に変更する画像修復を実行する方法をご紹介します。 Stable Diffusion 概要 Stable Diffusionは、拡散モデルによる画像合成モデルです。 自然言語で入力されたテキスト(prompt)から画像を生成するText to Imageタスクを実現します。 Latent Diffusionをベースとした本モデルは、非常に大規模なデータセットであるLAION-5Bを用いてトレーニングされています。 GoogleのImagenやOpenAIのGLIDE, DALLE-2など最新の画像生成モデルは社

                                            [Stable Diffusion] AIで指定範囲をテキストで指示して画像修復 [inpainting]
                                          • 深層学習で「服の仮想試着」ができるSMISモデルについて解説&実際に動かしてみる - Qiita

                                            はじめに 中国の華中科技大学と北京大学による研究チームがCVPR2020の学会で「Semantically Multi-modal Image Synthesis」(SMIS)という論文を出しました。この論文によると、写真一枚から服とズボンの柄・色を変更して、仮想的な試着したような画像を生成できます。この論文では画像をオブジェクトごとにクラス分けし、部分的に画像を入れ替えて合成する深層学習ベースの手法を用いています。 今回はSMISモデルの簡単な解説と実際に試してみるやり方について説明します。動かしてみたい人は「モデルを動かしてみる」から見てください。 論文の詳細は下記になります。 論文: https://arxiv.org/abs/2003.12697 プロジェクトページ: https://seanseattle.github.io/SMIS/ Github: https://githu

                                              深層学習で「服の仮想試着」ができるSMISモデルについて解説&実際に動かしてみる - Qiita
                                            • 採用目的2021 SUZURI編 - Pepabo Tech Portal

                                              はじめに こんにちはSUZURIでシニアエンジニアリングリードをやっております黒瀧です。今回このブログを書いている目的は採用目的です。よろしくお願いいたします。 採用目的とは? ペパボの採用コンテンツ(?)として、2016年にPEPABO HEADZ IN DA HOUSE!!1 - GMOペパボの「採用目的」のようなことをやっていました。曲を作ったり、リリックを書いたり、アートワークを作ったりしていますね、2021年採用目的復活ということで、新しいリリックを書いたりはしていませんが、採用目的をやっていきたいと思います。 SUZURIでは採用目的Tシャツも販売しています。こちらからどうぞ!これまでの採用目的に関する記事は、#採用目的 に関する記事一覧から見ることができます。 テックカンパニーを見据えたエンジニア組織 さて、SUZURIでは、すでに明らかになっている課題と、これから課題になっ

                                                採用目的2021 SUZURI編 - Pepabo Tech Portal
                                              • 富士フイルムX10という2011年のカメラが素敵だ - 畳の夢

                                                2011年発売、finepix X100に続く富士フイルムXシリーズの第2号機。2ヶ月前に1万円ちょっとで手に入れたこのカメラを好きになってしまった。気づけば毎日持ち歩いている。 昔の機種なのでいろいろと欠点はあるけど、どうにかして良い写真を撮りたくなる、いや撮ってあげたくなる不思議なカメラ。謎の上から目線を発動してしまったが、そんな好きの話をしたい。 X10を使ってて楽しい理由は主に3つある。 一つは起動が早いということ。次に、今は廃れた技術である画素混合ダイナミックレンジ拡張。そして1cmマクロだ。 1. 電源onと手動ズームの一体化が気持ちいい このカメラ、普通のコンデジと違って電源ボタンがない。レンズをoffから28mmまでひねると電源onになる。このスチャとひねる感触が心地よい。モデルガンにマガジンを込めてジャキッてスライドし弾を装填する、ああいうフェチズムに近いものがある。もし

                                                  富士フイルムX10という2011年のカメラが素敵だ - 畳の夢
                                                • サントリー、生成AIで「C.C.レモン」を擬人化 期間限定でプロモーションに利用

                                                  サントリー食品インターナショナルは7月27日、炭酸飲料「C.C.レモン」を擬人化したキャラクターを生成AIで制作したと発表した。同社ではこのキャラクターを使ったプロモーションを期間限定で展開する。利用した画像生成AIサービスは明かしていない。 社内のC.C.レモン担当者たちの顔写真を生成AIにインプットし、キャラクターを顔を出力。髪形や年齢は「C.C.レモンらしさを感じるもの」を選んだ。衣装は、C.C.レモンのパッケージカラーである黄や緑、赤色を中心にしたコーディネートになるようプロンプトを調整したという。 プロモーションの第1弾として、このキャラクター自己紹介動画を公開している。キャラクターのせりふや声、アニメーションなども、AIチャットサービス「ChatGPT」や「Google Bard」などのAIを利用して生成したものを人の手で修正して完成させたという。 関連記事 サントリー、Cha

                                                    サントリー、生成AIで「C.C.レモン」を擬人化 期間限定でプロモーションに利用
                                                  • Stable Diffusion入門-蒸気機関が高度に発達したレトロなアニメ(スチームパンク)の世界観 - 電通総研 テックブログ

                                                    電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、蒸気機関が高度に発達したレトロなアニメ(スチームパンク)の世界観編です。 Steampunk(スチームパンク)って言葉を知ってますか。SFから派生していて、蒸気機関(Steam)が高度に発達したレトロな世界観です。有名な作品だと「天空の城ラピュタ」、「ハウルの動く城」、「鋼の錬金術師」などがあります。 pixiv百科事典 スチームパンク 今回は、Steampunkの世界に飛び込んでみましょう。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女

                                                      Stable Diffusion入門-蒸気機関が高度に発達したレトロなアニメ(スチームパンク)の世界観 - 電通総研 テックブログ
                                                    • HEIF形式の画像をpngやjpegにしてブラウザで扱う | nabeen.be

                                                      画像合成機能を実装するにあたって、ユーザーの画像を取り扱いたい、というケースは多々あると思います。 実際今僕が携わっている案件もまさにそうで、inputのtype='file'で受けてそれを canvas 上に描画して、最終的に画像合成…という流れです。 ただこれには問題があって、iOS11 以降でデフォルトとなっている HEIF 形式(.heic、.heif)は、そのまま WEB 上で取り扱うことが出来ません。普通に出来ると思ってましたが、完全に甘ちゃんでした。大甘です。 今回はなんとか HEIF を WEB で取り扱えるようにしていきます。 結論だけ先に述べると、JavaScript 実装があるにはあるんですが、ちょっと今回のプロジェクトにいれるのはどうなんだ…という結果になりました。ただ問題になるのは PC からのアップロード時のみなので、特に制約のないプロジェクトであれば、普通に導

                                                        HEIF形式の画像をpngやjpegにしてブラウザで扱う | nabeen.be
                                                      • アニメーション撮影の基本処理|senzui

                                                        先日Twitterでアニメーションの撮影に使用するとあるソフトウエアを紹介したのですが、思った以上に反応がありました。 AfterEffectsのセルアニメ用プラグイン「KW_Effects」がアップデート。ついにM1プロセッサに対応! これでやっとM1のハイスペックでアニメ撮影が可能になるよ。https://t.co/SnCEqaclgI After Effects動作確認: 2023 動作確認環境: M1プロセッサ Mac 動作確認OS: macOS13.2 Ventura — yoichi senzui@ナイス害 (@sen_cha) February 21, 2023 まず普通の人は使う機会の無いものですが、それなりに反応があったので、今回はアニメの撮影技術について少し書いてみようと思います。 紹介したソフトウエアはKW_Effectsというアニメーション撮影を行う上で最も基本にな

                                                          アニメーション撮影の基本処理|senzui
                                                        • Stable Diffusion 2.1-AUTOMATIC1111 - 電通総研 テックブログ

                                                          電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、Stable Diffusion 2.1-AUTOMATIC1111です。 Stable Diffusionも2.1がもう出てしまいました。 AUTOMATIC1111のColab用ノートブックにはまだStable Diffusion 2.1に対応したノートブックが公開されていないので、僕の方で、作っておきました。本家で公開されるまで臨時でお使いください。 AUTOMATIC1111のStable Diffusion 2.1対応ノートブック 追記 本家からもv2.1対応版がリリースされました。今後は、こちらをお使いください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1

                                                            Stable Diffusion 2.1-AUTOMATIC1111 - 電通総研 テックブログ
                                                          • 書く・・と、描く事の意義 - 脇道を行く

                                                            WIN10が何とか、そこそこやれてきてます WIN10に早く慣れる為に? この課題が、高齢者にはかなりキビしい !! お絵描き方面も 去年の秋から四苦八苦 !! はてな生活においての gimpでのデザインと画像編集方面 自然をいじりすぎたツケ WIN10が何とか、そこそこやれてきてます ◎ 先日5200円で購入の、WIN10ちゃんが入ったパソですが ある程度の部品追加なども片ずき 現在はネットとブログを中心に、トロいながらに動けてます。 イカレてしまった2台のパソを、自分では修理が出来なくなってしまった・・ と認識する迄に、かなりの時間をとられ また、悔しい限りでしたが、まさかに2束3文感覚のこのパソが そこいらを大いにカバーしてくれ 今日も文をやれてたりしています ウィンドウズでのインターネット生活は、5年ぶりくらいなので感慨もひとしお ◎ 購入してすぐに中を開けて、ハードディスクをその

                                                              書く・・と、描く事の意義 - 脇道を行く
                                                            • Visual ChatGPT を踏襲した視覚ツールの利用 | keywalker

                                                              #ChatGPT #LangChain はじめに 本記事では Visual ChatGPT の枠組みを踏襲して LangChain の Tools を用いたマルチモーダルへのアクセス方法について紹介します。 GPT-3 や ChatGPT では対象となるモダリティが言語情報に制限されていたこともあり、Visual ChatGPT の枠組みは事業範囲の拡大に貢献するかもしれません。 おことわり 再現のためのスクリプトについて現状公開予定はありません…。 著者は自然言語処理エンジニアとして絶賛勉強中です。記事の誤り、推奨される方法等がありましたらご指摘いただけますと幸いです。 本記事は読者層を明確に想定した上で書かれたものではありません。就職先として弊社を考えている学生の方々、弊社クローラサービスの利用を検討されているお客様、著者と同様に絶賛勉強中のエンジニアなど、特定の個人に刺さる内容であれ

                                                                Visual ChatGPT を踏襲した視覚ツールの利用 | keywalker
                                                              • 【チートシート】G検定の試験当日のカンペ

                                                                はじめに G検定に向けたカンペを作っておこうと思う。 ネットと書籍の情報だと、カンペはOKらしいので、 2021年7月の公式サイトのシラバスに乗っている単語を中心に記載する。 カンペ 人工知能の定義 人工知能とは何か コンピュータを使って、学習・推論・判断など人間の知能のはたらきを人工的に実現したもの。 AI効果 人工知能で何か新しいことが実現され、その原理が分かってしまうと、「それは単純な自動化であって知能とは関係ない」と結論付ける人間の心理的な効果 人工知能とロボットの違い ロボット:あらかじめプログラムされた動作を正確に行う。自己判断で進めることはできない。 人間で例えると「体」 人工知能:自立して発展していく。自ら学習して精度を高めることができる仕組み。 人間で例えると「脳」 エージェント 事前に定義された目標を達成するためのコードまたはメカニズム 「チャットボット」「ソフトウェア

                                                                • ImaGen v0.1 - ノードベース画像合成&生成ツール!Windows版が無料公開!Maya版も開発中!

                                                                  シミュレーション 技術 技術-Technology Vertex Block Descent - 高速&安定の物理シミュレーション技... 2024-05-06 ユタ大学博士課程候補者でVisureTechの創業者であるAnka Chen氏らによる、高速かつ安定するとされる次世代物理シミュレーション技術『Vertex Block Descent (VBD)』の動画とプロジェクトページが公開されています! 続きを読む Unreal Engine アセット アセット-Asset Lava Lamp Configurator - シェーダーでリアルに表現された... 2024-05-06 プログラマーでシェーダーアーティストのnevermoreによるUnreal Engine向けラバライトアセット『Lava Lamp Configurator』がリリースされました! 続きを読む

                                                                    ImaGen v0.1 - ノードベース画像合成&生成ツール!Windows版が無料公開!Maya版も開発中!
                                                                  • 奇想同人音声評論誌「空耳2」準備号のお知らせ/1メートルの殻:主観化するメディアとコンテンツ - セミになっちゃた

                                                                    C103に出展します サークル「空耳製作委員会」より、2023年12月31日(日)に開催されるコミックマーケット(C103)東地区 ヒ-08b にて、「奇想同人音声評論誌 空耳2 準備号」を頒布予定です。 「空耳2」は現在編集中で、音声作品有識者による評論やクリエイターへのインタビュー、また前作同様に変わった音声作品のレビューを掲載します(年度内を目処に発行予定です)。 今回頒布する準備号では、作品レビュー数点と、妄想研究所「テレバーチャルヘッド」を軸にした私の論考「能動的鑑賞論:「テレバーチャルヘッド」はバイノーラルをどう超克するか(仮)」を掲載します。 「テレバーチャルヘッド」は「聴取者が頭を動かしながら聞くことで、通常のバイノーラル音声作品よりもリアルな体験が得られる」というエポックメイキングな音声作品です。以下に、「空耳」第一号に掲載した「1メートルの殻:主観化するメディアとコンテ

                                                                      奇想同人音声評論誌「空耳2」準備号のお知らせ/1メートルの殻:主観化するメディアとコンテンツ - セミになっちゃた
                                                                    • 弱点を克服し、さまざまな画像処理と融合するNeRF最前線 | モリカトロンAIラボ

                                                                      複数の2D画像から3Dシーンあるいは3Dオブジェクトを生成するNeRF(Neural Radiance Fieldsの略称)は、現在もっとも研究がさかんなAIグラフィック技術のひとつです。モリカトロンAIラボでは、この技術に関連した特集記事をすでに2本公開しました。本稿では、2023年時点での同技術の最前線を紹介します。 参考記事:2D画像だけで大丈夫。3D画像や3Dオブジェクトを自動生成するAIまとめ リアルタイム生成も可能に。進化する2Dto3D生成AIの最新研究紹介 複雑な3Dシーン生成やメモリ消費量削減を実現NeRFは3Dシーンや3Dオブジェクトを高度なCGスキルがなくても制作できる便利な技術である反面、複雑な3Dシーンの生成が苦手だったり生成時のメモリ消費量が多かったりする弱点があります。こうした弱点を克服しようとする研究が、すでに多数発表されています。 DeepMindの研究チ

                                                                        弱点を克服し、さまざまな画像処理と融合するNeRF最前線 | モリカトロンAIラボ
                                                                      • Stable Diffusion入門-かわいい動物の擬人化 - 電通総研 テックブログ

                                                                        電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、かわいい動物の擬人化用の呪文です。 Stable Diffusionって、動物の擬人化が難しいんです。例えば犬にテニスをさせたいとします。 パッと思いつくのはこんな呪文です。 illustration of cute dog playing tennis ... 出力結果 コレジャナイ感が満載ですね。かわいい動物の擬人化に成功したので、その方法を紹介します。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文編 美少女アニメ画

                                                                          Stable Diffusion入門-かわいい動物の擬人化 - 電通総研 テックブログ
                                                                        • 5万円台のグーグル製5G対応「AIスマホ」Pixel 6aハンズオン | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                                                                          Google(グーグル)が新しい5G対応スマートフォン「Google Pixel 6a」を7月28日に発売する。グーグル独自設計の「Tensor」チップを載せた5万円台の高機能スマホだ。上位モデルの「Google Pixel 6 Pro」や価格帯が近いアップルの5G対応「iPhone SE」と比べながら、Pixel 6aのファーストインプレッションを報告する。 独自設計「Tensor」チップによる便利機能が充実 グーグルは2021年に、独自設計のシステムオンチップであるTensorを載せたPixel 6シリーズを発売した。Tensorチップによる高度な言語認識、カメラ機能が飛躍を遂げたことで、Android陣営の中でも異彩を放つスマホとしてPixel 6シリーズが注目されるようになった。筆者もPixel 6 Proを日々使いながら、精度の高い音声文字起こしに対応する「レコーダー」アプリにい

                                                                            5万円台のグーグル製5G対応「AIスマホ」Pixel 6aハンズオン | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                                                                          • Google、驚異的な進化を遂げた動画生成AI「Lumiere」を発表 | TEXAL

                                                                            Googleはこのほど、動画作成のための同社の最新AIモデル「Lumiere」を発表した。Lumiereは映像合成を大幅に改善するもので、Googleは、「リアルで多様かつ一貫性のある動き」を作り出すことが、AIベースの映像生成の主要課題のひとつであったと述べている。Lumiereは時空間拡散モデルを提供することで、この問題を解決する(あるいは解決しようとする)ことができるようだ。 Lumiereでは、ユーザーは、テキストによるプロンプトを書いたり、ソース画像を提供したり(その画像が本物であろうと、リアルであろうと、編集されていようと関係ない)、ターゲットスタイルとして参照画像を使用することで、まったく新しいビデオクリップを作成することができる。 Lumiereは、AIモデルのシングルパスによってビデオクリップ全体を一度に生成する、斬新な「時空間U-Netアーキテクチャ(STUNet)」を

                                                                              Google、驚異的な進化を遂げた動画生成AI「Lumiere」を発表 | TEXAL
                                                                            • Visual Thinking with TouchDesigner プロが選ぶリアルタイムレンダリング&プロトタイピングの極意

                                                                              ハリウッドやメディアアート界から熱い注目を集めるTouchDesigner。本邦初の入門解説書が遂に登場! TouchDesignerは、リアルタイム映像出力や大規模インスタレーションで威力を発揮する、ノードベースのビジュアルプログラミングツール。表現のアイデアを素早く形にでき、かつ拡張性と安定性にも優れた、アートとテクノロジーの結節点たりうる開発環境です。バージョン099からはMac版も公開され、さらにユーザーを拡げています。 本書は、これからTouchDesignerを始めようとしている入門者、そしてもっと使いこなしたいと思っている初・中級者に向けて、基礎スキルから実践的な応用法までを網羅した解説書です。先駆者たちへのインタビュー、著名デジタルアーティストたちの制作プロセスと設計思想に迫ったコンテンツも掲載。TouchDesigner本家Derivative社 ベン・ヴォイト氏特別監修

                                                                                Visual Thinking with TouchDesigner プロが選ぶリアルタイムレンダリング&プロトタイピングの極意
                                                                              • AzureFunctionsとPowerAppsでぬり絵アプリを作ってみた - Qiita

                                                                                概要 Power Appsで自律神経を整えよう、ぬり絵アプリを作ってみました。 Power Appsにはペン入力がありますが現状背景画像を設定できないので、下絵画像とペン入力画像を合成をAzure Functions(C#) でAPIを作って対応しました 応用すると、現場報告系のアプリで、撮影した写真に◯を書いて保存するようなアプリも作成可能です。 ※ペンタブで塗っています。 アプリの仕様 塗り絵の下絵はギャラリーから選べる(SharePointリストに) 塗った絵に名前を付けて保存できる(AzureFunctions/Automate) あとで作品一覧を閲覧できる(ドキュメントライブラリ) 以前Remove.bgというサービスを使って手軽にお絵かきアプリを実現しましたが、無料プランだと回数制限があったり、性能の無駄遣い感があったため、自前でC#を使ってAzureFunctions上にAP

                                                                                  AzureFunctionsとPowerAppsでぬり絵アプリを作ってみた - Qiita
                                                                                • ストーリーが手法を決める!『スパイダーマン:スパイダーバース』が実践した、未知なる表現を創り出す秘訣とは?

                                                                                  TOP 特集 ストーリーが手法を決める!『スパイダーマン:スパイダーバース』が実践した、未知なる表現を創り出す秘訣とは? CGはある意味熟成されつつあると言われる現代においても、まったく新しいビジュアルを生み出し、人々の記憶に強烈な印象を残した『スパイダーマン:スパイダーバース』(2018)。本作でVFXスーパーバイザーを勤めたダニー・ディミアン/Danny Dimian氏はこの映像を生み出すために大変重要な役割を果たした。ディミアン氏が制作中いかに考え、どのように決断していったのか話を聞いた。 TEXT_奥井晃二 / Kouji Okui EDIT_沼倉有人 / Arihito Numakura(CGWORLD) Special thanks to Foundry 『スパイダーマン:スパイダーバース』2019年8月7日(水)Blu-ray&DVD&3D&UHD発売/同日レンタル開始/6月

                                                                                    ストーリーが手法を決める!『スパイダーマン:スパイダーバース』が実践した、未知なる表現を創り出す秘訣とは?