並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 48件

新着順 人気順

Google Imageの検索結果1 - 40 件 / 48件

Google Imageに関するエントリは48件あります。 google画像AI などが関連タグです。 人気エントリには 『ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記』などがあります。
  • ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記

    タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの

      ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記
    • 「いらすとや」は要らなくなっちゃう?テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい

      小猫遊りょう(たかにゃし・りょう) @jaguring1 毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。 小猫遊りょう(たかにゃし・りょう) @jaguring1 うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた(DALL-EとCLIP)。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/

        「いらすとや」は要らなくなっちゃう?テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい
      • 軽量Dockerイメージに安易にAlpineを使うのはやめたほうがいいという話 - inductor's blog

        はじめに やめろ、ではなく、やめたほうがいい。です。自分のユースケースに合ってるか今一度確認することを推奨します。基本的にはAlpineは避けたほうが良い、というのが2021年時点での私の認識です。 なんで? libcに一般的な互換性が不足しているからです。Ruby、Python、Node.jsなどでNativeモジュールをバンドルしているアプリケーションの場合、パフォーマンスの劣化や互換性の問題にぶち当たる場合があります。 superuser.com あとは他のベースイメージの軽量化もそれなりに進んできていて、Alpineが定番軽量イメージと言う認識は2018年頃には消えつつあったかなという認識でいます。 どうすりゃええねん ※Debian Slimがあるやんってツッコミ結構もらったんですが、Slimは当たり前過ぎてもう紹介しなくていいかなっていう甘えで省略していました。よろしくおねがい

          軽量Dockerイメージに安易にAlpineを使うのはやめたほうがいいという話 - inductor's blog
        • ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所

          日本時間2025年3月26日、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:

            ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所
          • Googleのエンジニアが「ウェブサイトの画像読み込み」を最適化する方法を解説

            ウェブサイトを閲覧していると「画像の読み込みが遅い」という場面に遭遇したことがある人は多いはず。画像はウェブサイトのパフォーマンスを左右する要素のひとつであり、ウェブ開発において取り扱いに注意すべきものです。そんな画像をウェブサイトで扱う際の最適化方法について、GoogleのエンジニアであるMalte Ubl氏が解説しています。 Maximally optimizing image loading for the web in 2021 https://www.industrialempathy.com/posts/image-optimizations/ ◆img要素にwidthとheightを指定する アスペクト比を維持したまま画像サイズを変更するには、「style」要素に「max-width: 100%」や「height: auto」と指定しておく手法がよく用いられます。この手法に加

              Googleのエンジニアが「ウェブサイトの画像読み込み」を最適化する方法を解説
            • 画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ

              2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf

                画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ
              • Googleが「ガビガビの低解像度画像を高解像度画像に変換するAIモデル」の性能を改善、人間が判別できないレベルに

                GoogleのAI研究チームであるGoogle AIが、低解像度画像にあえてノイズを追加して「純粋なノイズ」になるまで加工し、そこから高解像度画像を生成する「diffusion model(拡散モデル)」という手法を改善する新たなアプローチを発表しました。「画質の悪い低解像度画像から高解像度画像を生成する技術」には、古い写真の復元から医療用画像の改善まで幅広い用途が想定され、機械学習の活躍が期待されているタスクの1つです。 Google AI Blog: High Fidelity Image Generation Using Diffusion Models https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html Enhance! Google researchers detail new m

                  Googleが「ガビガビの低解像度画像を高解像度画像に変換するAIモデル」の性能を改善、人間が判別できないレベルに
                • AIで特定キャラを描く(DreamBoothで追加学習)|lisa

                  概要DreamBoothとは追加学習することで、AI(StableDiffusion)で特定のキャラや物を描くためのモデル(データ)作るツールです。 例えば、ドラゴンクエスト10オンラインというゲームのアンルシアというキャラがいます。 ドラゴンクエスト10のアンルシア 公式サイトより引用 https://hiroba.dqx.jp/sc/election/queen2021/vote/confirm/1/nologinこのキャラの画像を18枚ほどAIに読み込ませ、追加学習し、AIに描かせた絵が以下の絵になります。 これ見ると、単なる髪型や顔が似ているレベルではなく、服の模様レベルまで再現できている事がわかります。 今までStableDiffusionの欠点として、同じキャラを安定して描くのが苦手というのがありましたが、DreamBoothを使うことで克服することが出来ます。 これにより、A

                    AIで特定キャラを描く(DreamBoothで追加学習)|lisa
                  • グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表

                    グーグルは1月2日、従来のモデルよりも大幅に効率的でありながら、最先端の画像生成性能をもつテキスト画像AI生成モデル「Muse」を発表した。 競合モデルと同クオリティかつ超高速化 近年「Stable Diffusion」やOpenAIの「DALL-E 2」など、テキストから画像を生成するAIは驚くべき進化を見せている。グーグルもすでに「Imagen」と「Parti」という画像生成AIを発表しているが、「Muse」はそのどれとも異なる新しいモデルだ。

                      グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表
                    • なぜGoogle Meetの背景ぼかしが最強なのか(一般公開版)

                      はじめに 最近ついに、Google Meet に背景ぼかし機能が利用可能になりましたよね。日本語だとインプレスのケータイ Watchの記事などで紹介されてます。確か 2020 年 9 月末前後で順次リリースされていたと記憶しています。 このときは「背景ぼかし」の機能しかなかったのですが、最近(私が気づいたのは 2020/10/30)更にアップデートされました。アップデートで「背景差し替え」機能が付いて、ぼかし機能もぼかし効果が強弱 2 つから選べるようになりました。まだ日本語のニュース記事は見てないですが、Googleによるアップデートの発表はちゃんとされています。 そして、Google AI Blog でBackground Features in Google Meet, Powered by Web MLという記事が公開され、実装についての解説がされました。 この記事はその解説記事を

                        なぜGoogle Meetの背景ぼかしが最強なのか(一般公開版)
                      • Googleで『Japan』と画像検索すると出てくるこの景色に実際に行ってきた「ここは日本ではなく"Japan"」「架空だと思ってた」

                        いーにーさん @e233chuoline 「ここ本当にあるんだ...」という反応が意外と多い。 近くの高校の陸上部だったので、トレーニングでよくここの階段を駆け上がってたよ 2020-11-15 08:30:05

                          Googleで『Japan』と画像検索すると出てくるこの景色に実際に行ってきた「ここは日本ではなく"Japan"」「架空だと思ってた」
                        • グーグルが開発した画像圧縮ツールSquoosh。フロント開発向けにNode.jsで扱う方法まとめ - ICS MEDIA

                          グーグルが開発した画像圧縮ツールSquoosh。フロント開発向けにNode.jsで扱う方法まとめ 『Squooshスクーシュ』というGoogleが開発した画像圧縮ウェブアプリがあります。ブラウザで変換結果を見ながら圧縮設定ができるので、画像圧縮の難しい知識を持たない方でも使いやすいことが特徴です。圧縮だけでなく、WebPなどの各種フォーマットへの変換・リサイズといったこともできる便利ツールです。 このSquooshをNode.jsで扱える『libSquoosh』が存在します。libSquooshは大量の画像を一括で圧縮、WebPへの変換、リサイズなどの処理をこれ1つで完結できるのがポイントです。昨今のウェブはページの読み込み時間が重視される傾向があります。画像のファイルサイズは読み込み時間に大きく影響するため、画像圧縮は重要なテクニックです。libSquooshをwebpack・Viteと

                            グーグルが開発した画像圧縮ツールSquoosh。フロント開発向けにNode.jsで扱う方法まとめ - ICS MEDIA
                          • Google Colab で はじめる Stable Diffusion v1.4|npaka

                            2. ライセンスの確認以下のモデルカードにアクセスして、ライセンスを確認し、「Access Repository」を押し、「Hugging Face」にログインして(アカウントがない場合は作成)、同意します。 4. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハードウェアアクセラレータ」に「GPU」を選択。 (2) 「Stable Diffusion」のインストール。 # パッケージのインストール !pip install diffusers==0.3.0 transformers scipy ftfy(3) トークン変数の準備。 以下の「<HugginFace Hubのトークン>」の部分に、先程取得したHuggingFace Hubのトークンをコピー&ペーストします。 # トークン変数の準備 YOUR_TOKEN="<H

                              Google Colab で はじめる Stable Diffusion v1.4|npaka
                            • Colabで動かすStableDiffusion実装|深津 貴之 (fladdict)

                              自分がつかってる、Google Colab用StableDiffusion環境を公開しました。 海外のWEB UIのが重いのと、やりたいことが微妙に違うので自分なりに作った。公式のDiffuserを使わないので軽いです。無課金のcolabでも動くのではないかと思います。 使い方GitHubページの「Open in Colab」ボタンをおして、colabで開く。 このページ上部のメニューで、「ランタイム > ランタイムのタイプを変更」からGPUを有効化を確認 HuggingFaceでアカウントを作成 StableDiffusionのモデルページで、「利用規約」に合意する。 モデルファイル sd-v1-4.ckpt をダウンロード モデルファイルを Google Drive等にアップロード 下のセル 「1-1. Google Driveとの接続」を実行 下のセル 「1-2. のフォーム」に、G

                                Colabで動かすStableDiffusion実装|深津 貴之 (fladdict)
                              • Google vs ChatGPTで世界がヤバいかもしれない理由

                                Google vs ChatGPTで世界がヤバいかもしれない理由2023.02.17 21:00149,270 西谷茂リチャード ChatGPTなどのAIツールは非常に便利です。それに目をつけたマイクロソフトは、Googleの検索エンジンを凌駕する「回答エンジン」を発表しました。AIの進化にワクワクする一方、火蓋が切られたAI競争のその先には核レベルの危機も潜んでいそうです。 ChatGPTの驚きImage: Open AIChatGPTとは無料で使え、命令すればいろんな文章を生み出してくれる、超絶便利な対話型AIサービスです。SiriやGoogle アシスタント、Alexaとは比べ物にならないくらい賢くて、本当にびっくりしました。 ChatGPTにいろいろな質問をしている様子「空と海はどうして青いの?」「パソコンにできてスマホにできないことはなに?」といったふわっとした質問に答えてくれま

                                  Google vs ChatGPTで世界がヤバいかもしれない理由
                                • そろそろWebPに切り替えよう。変換方法や対応ブラウザ、使い方を解説! | Web Design Trends

                                  WebP(ウェッピー)は、Googleが開発している次世代画像フォーマットです。PNGやJPEGと比べてファイルサイズを抑えることができ、トラフィックの削減やページ表示速度の向上を実現することができます。 今回は、WebP(ウェッピー)の基本と、メリットやデメリット、変換方法、対応ブラウザなどをご紹介したいと思います。 WebP(ウェッピー)とは? WebP(ウェッピー)は、Googleが開発している次世代画像フォーマットで、拡張子は「.webp」です。 WebPは、JPEGやPNGと比べ、同程度の画質の画像をより小さなファイルサイズで保存することができます。Googleの発表では、PNGよりも26%、JPEGよりも25%〜34%程度ファイルサイズを抑えることができると言われています。 また、WebPは背景透過(アルファチャンネル)や、アニメーションにも対応しています。つまり、JPEGのよ

                                    そろそろWebPに切り替えよう。変換方法や対応ブラウザ、使い方を解説! | Web Design Trends
                                  • Google Bard便利すぎ。Gmailから検索して表まで作るだなんて…

                                    Google Bard便利すぎ。Gmailから検索して表まで作るだなんて…2023.12.20 20:00104,959 小暮ひさのり 仕事、楽になる予感しかしない。 Googleのチャットボット「Google Bard」。話してみると、受け答えはまだまだ勉強中といった感じで、ChatGPTの方が先を行っている感はありますけど、それでも新機能を突っ込んでくるのがGoogleの偉いところ。 先日、「Google Workspace」の拡張機能が実装され、Gmail、Drive、Docsとも連携できるようになりました。特に刺さったのがGmail。この機能、Gmailをメインでやりとりしているなら使ったほうがいいですよ。 Gmailからいろいろな情報を探して提示できるのが神すぎ…Image: 小暮ひさのりGmailを見られて助かるのが、「あのメール返したかな?」とか「あの案件の期日いつって言われ

                                      Google Bard便利すぎ。Gmailから検索して表まで作るだなんて…
                                    • 「Google フォト」に新方式のシャープ・ノイズ除去 ~ほぼどんな画像もきれいに/カメラデバイスに依存しない、新しいアプローチ

                                        「Google フォト」に新方式のシャープ・ノイズ除去 ~ほぼどんな画像もきれいに/カメラデバイスに依存しない、新しいアプローチ
                                      • グーグルの新たな画像生成AIツール「ImageFX」の使い方

                                        印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleが人工知能(AI)に多額の投資を行ってきたことを考えれば、同社が先頃、独自の画像生成AIツール「ImageFX」を公開したのは、意外なことではない。ImageFXは、OpenAIの「DALL-E 3」や「Midjourney」「Image Creator from Microsoft Designer」といった多くの画像生成AIツールの強力なライバルになるはずだ。 ImageFXは、テキストから画像を生成するGoogleのテクノロジー「Imagen」の最新世代である「Imagen 2」を利用する。ImageFXで作成されるすべての画像には、DeepMindの「SynthID」が埋め込まれる。SynthIDは、肉眼では見えない

                                          グーグルの新たな画像生成AIツール「ImageFX」の使い方
                                        • ストリートビューではとある地点で「絶対に追い抜いてはいけない車」を猛スピードで抜いて捕まる一部始終が確認出来る

                                          ヨシフ・スターリン料理長.zip @Stalin_Bot_JP @Masa_strawberry 運転手の処分については不明ですが、切符を切られた後に開放されたっぽいです。(1枚目) その後、本線に戻ってからはよほどショックを受けたのか、周りの車にどんどん抜かされる低速でずっと走り続けてますね......。(2枚目、3枚目) pic.twitter.com/gOrKpoNTUm 2023-04-25 21:13:59

                                            ストリートビューではとある地点で「絶対に追い抜いてはいけない車」を猛スピードで抜いて捕まる一部始終が確認出来る
                                          • 硫黄島がすごい勢いで隆起していて戦時中に使われていた船が陸に上がっていると聞いたのでGoogle Earthで確認したら本当だった

                                            自然人(しぜんびと) @shizenbito_ 硫黄島がものすごい勢いで隆起していて、 太平洋戦争の際に沈んだ船やら戦車が陸に上がってきていると聞いて、 「そんなアホな。そこまで隆起してるの」 と思って、Google Earthで見たら、 出てきてるー! こんなに隆起してるのか? だいたい水深10mぐらいのところに沈んでいたモノらしいが、水深と隆起率の数字はわからないです。 #自給自足 #戦争反対 #田舎暮らし 2024-10-17 18:28:21

                                              硫黄島がすごい勢いで隆起していて戦時中に使われていた船が陸に上がっていると聞いたのでGoogle Earthで確認したら本当だった
                                            • DreamFusion: Text-to-3D using 2D Diffusion

                                              Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image

                                                DreamFusion: Text-to-3D using 2D Diffusion
                                              • 【QGIS】GISソフトでGoogle Earth Engineを操作する【衛星データ解析】 - LabCode

                                                QGISとは? QGISは、地理情報システム(GIS)のためのオープンソースソフトウェアで、地理データの閲覧、編集、分析を行うことができます。QGISは多くのプラットフォーム(Windows、MacOS、Linux)に対応しており、商用GISソフトウェアと比較しても多機能でありながら無料で利用することができます。 主な特徴としては以下があげられます。 多機能かつ柔軟性が高い: QGISは、地理データのインポート・エクスポート、地図作成、空間解析など、多くのGISタスクを実行することができます。 オープンソース: ソースコードが公開されているため、コミュニティの支援を受けつつ進化しています。また、カスタマイズや拡張が容易です。 豊富なプラグイン: サードパーティによって開発されたプラグインが多数あり、特定の機能を追加することができます。 GEEプラグインについて 今回紹介するGEEプラグイン

                                                  【QGIS】GISソフトでGoogle Earth Engineを操作する【衛星データ解析】 - LabCode
                                                • Googleが無料で簡単に使える画像生成AI「Imagen 2」を公開したので使ってみた

                                                  Googleが高品質な画像を簡単に生成できるAI「Imagen 2」を発表しました。Imagen 2はチャットAI「Bard」やGoogleのAIプラットフォーム「Vertex AI」などで利用可能。すでに日本からも利用可能だったので実際に使ってみました。 New and better ways to create images with Imagen 2 https://blog.google/technology/ai/google-imagen-2/ Imagen 2はすでにBardに組み込まれており、「○○の画像を生成して」という内容のメッセージを送信するだけで画像を生成することができます。Bardには以下のリンクからアクセスできます。 Bard https://bard.google.com/chat Googleにログインした状態でBardにアクセスすると以下のような画面が表示

                                                    Googleが無料で簡単に使える画像生成AI「Imagen 2」を公開したので使ってみた
                                                  • Google Chrome、南京錠アイコンを2023年9月に廃止

                                                    Google Chromeチームは5月2日(米国時間)、「Chromium Blog: An Update on the Lock Icon」において、2023年9月にリリースを予定している「Google Chrome 117」からアドレスバーにおける南京錠アイコンの表示を廃止すると伝えた。代わりに「調整」を意味するアイコンを表示すると説明している。 Chromium Blog: An Update on the Lock Icon アドレスバーの南京錠アイコンはWebブラウザがHTTPSで通信を行っていることを示すものとして導入された。通信の多くがHTTPで行われていた時代、傍受を防ぎやすいHTTPSが使われていることを示すために南京錠のアイコンが導入された。導入当初このアイコンは役割を果たしたが、現在この意味は失われはじめていると点をGoogleは指摘している。 Googleは次の2つ

                                                      Google Chrome、南京錠アイコンを2023年9月に廃止
                                                    • 無料で使える画像をGoogle画像検索で簡単に探せる機能がアップデートで追加される

                                                      Googleが2020年8月31日(月)に発表したアップデートにより、Google画像検索で簡単に無料で使える画像や商用利用可能な画像を探せるようになりました。探した画像の利用規約も簡単にアクセスできるようになっています。 Learn how to find image licensing information on Google Images https://blog.google/products/search/learn-how-find-image-licensing-information-google-images/ まず、Google画像検索で検索したい単語を入力してエンターキーを押します。 以下のように画像が大量に表示されますが、無料で使用できる画像や転載不可・有料の画像などが混在している状態です。画像を絞り込むには「ツール」をクリック。 「ライセンス」をクリックすると、

                                                        無料で使える画像をGoogle画像検索で簡単に探せる機能がアップデートで追加される
                                                      • GoogleとAppleの違いを画像で表現してみた デザイン会社 ビートラックス: ブログ

                                                        スマホ、スマートホーム、クラウドサービスなど、多くの分野で世界レベルで覇権を競っているのがシリコンバレーの巨大テクノロジー企業、GoogleとApple。 時価総額ランキングでも常に上位にランキングし、ビジネスモデルの側面ではかなり共通点がありそうなこの2社。しかし実はさまざまな側面でかなり異なる戦略を取っている。 GoogleとAppleにおけるデザイン、組織、カルチャー、マーケティングなど10の項目に対してのアプローチの違いを画像で表現してみた。 Google: ユーザーが欲しいと思っているものを作る Apple: ユーザーが欲しいはずのものを作る 「Appleはユーザーが欲しいとまだ気づいていないプロダクトを作ることが多い」 お客様第一主義とユーザー中心デザインの違いとは

                                                          GoogleとAppleの違いを画像で表現してみた デザイン会社 ビートラックス: ブログ
                                                        • ひとりで作る画像検索

                                                          このブラウザ バージョンのサポートは終了しました。サポートされているブラウザにアップグレードしてください。

                                                            ひとりで作る画像検索
                                                          • Google Colab で、お手軽 Text-to-Image

                                                            最近話題のお絵描きAIをGoogle Colabで試してみようという記事です。 ここで使うAIは、stability.aiの stable diffusion というモデルで、つい最近 CreativeML Open RAIL-Mライセンスの下、オープンソースでリリースされました。 StableDiffusionに関する日本語記事は、深津 貴之さんの記事が面白いので是非こちらをお読みください。 stability.aiの記事で、Google Colabを用いて使う方法についての説明があり、試してみたところ本当に簡単に実行できてしまったので、その手軽さを紹介できればと思います。 実際に試したい場合は、元記事のGoogle Colabのノートブックが丁寧に説明しているので、そちらをご覧いただければと思います。 試してみる。 必要なもの Google アカウント Hugging Face アカウ

                                                              Google Colab で、お手軽 Text-to-Image
                                                            • distroless imageを実用する | うなすけとあれこれ

                                                              distrolessは、Googleが提供している、本当に必要な依存のみが含まれているcontainer imageです。そこにはaptはおろかshellも含まれておらず、非常にサイズの小さいimageとなっています。余計なプログラムが含まれていないことは attack surfaceの縮小にも繋がり、コンテナのセキュリティについての事業を展開しているSysdig社が公開しているDockerfileのベストプラクティスとしてもdistroless imageを使うことが推奨されています。 Dockerfileのベストプラクティス Top 20 | Sysdig 軽量Dockerイメージに安易にAlpineを使うのはやめたほうがいいという話 - inductor’s blog また先日、inductorさんがこのようなブログ記事を書き話題になりました。この記事からdistroless ima

                                                                distroless imageを実用する | うなすけとあれこれ
                                                              • Muse: Text-To-Image Generation via Masked Generative Transformers

                                                                Muse: Text-To-Image Generation via Masked Generative Transformers Huiwen Chang*, Han Zhang*, Jarred Barber†, AJ Maschinot†, José Lezama, Lu Jiang, Ming-Hsuan Yang, Kevin Murphy, William T. Freeman, Michael Rubinstein†, Yuanzhen Li†, Dilip Krishnan† *Equal contribution. †Core contribution. We present Muse, a text-to-image Transformer model that achieves state-of-the-art image generation performance

                                                                  Muse: Text-To-Image Generation via Masked Generative Transformers
                                                                • WebPコーデックの重大な脆弱性対処でChromeなど主要Webブラウザが緊急更新

                                                                  米GoogleのChromeや米MicrosoftのEdgeなど、主要Webブラウザが9月11日から重大なゼロデイ脆弱性に対処するアップデートをリリースしている。この脆弱性「CVE-2023-4863」は、GoogleのWeb向け画像フォーマット「WebP」のヒープバッファオーバーフローに関するもので、既に悪用されているという。 この脆弱性は、米Apple Security Engineering and Architecture(SEAR)と加トロント大学のCitizen Labが6日に報告した。 本稿執筆現在、Chrome、Mozilla Firefox、Brave、Microsoft Edgeがこの脆弱性に対処するアップデートをリリースしている。 Googleは公式ブログで、「CVE-2023-4863のエクスプロイトが存在することを認識している」とした。 また、米Stack Dia

                                                                    WebPコーデックの重大な脆弱性対処でChromeなど主要Webブラウザが緊急更新
                                                                  • Googleが複数画像をミックスして新しいイメージを生み出す画像生成AI「Whisk」を日本含む100カ国以上で利用可能に、モデル・背景・スタイルの3つを画像orテキストで入力するとImagen 3がフュージョンしてくれる

                                                                    Googleが複数の入力画像をベースに新しい画像を生成できる画像生成AIの「Whisk」を、日本を含む100カ国以上で利用可能にしています。Whiskは入力画像をGeminiでキャプションに変換し、これをGoogleの画像生成モデルであるImagen 3で画像に変換しているとのことで、実際にどんな画像が生成できるのか気になったので使って確かめてみました。 Whisk - labs.google/fx https://labs.google/fx/tools/whisk 上記URLにアクセスして「SIGN IN WITH GOOGLE」をクリック。 「次へ」をクリック。 Googleのプライバシーポリシーを確認したら、「次へ」をクリック。 利用規約への同意を求められるので「同意して続行」をクリック。 Whiskでは写真をプロンプトとして使用することで、新しい画像を生成することができます。画像

                                                                      Googleが複数画像をミックスして新しいイメージを生み出す画像生成AI「Whisk」を日本含む100カ国以上で利用可能に、モデル・背景・スタイルの3つを画像orテキストで入力するとImagen 3がフュージョンしてくれる
                                                                    • 「Chrome」、動画フレームをコピーする新機能を追加--スクリーンショットが不要に

                                                                      Googleの「Chrome」を使っている人は、スクリーンショットを撮らずに動画フレームをコピーできる新しい方法を使えるようになった。同社は米国時間8月31日、Chromeの「Copy Video Frame」機能を発表した。その名称が示す通り、動画フレームをコピーする機能だ。 Googleは公式ブログで「Chromeで再生中の動画を好きなところで一時停止して、求めるフレームのきれいなコピーがとれる」と述べている。 Copy Video Frameを利用するには、Chromeで再生中の動画を一時停止し、動画フレームを右クリックして、ポップアップメニューからCopy Video Frameを選択すればいいとGoogleは説明している。 Googleは、いつものやり方で動画フレームのスクリーンショットを撮ると、画像の質が低くなり、動画のプログレスバーが最下部に映り込む可能性があると指摘している

                                                                        「Chrome」、動画フレームをコピーする新機能を追加--スクリーンショットが不要に
                                                                      • Whisk - labs.google/fx

                                                                        Ready to evolve your Image creation?Sign in and let's see what you can dig up.

                                                                        • Googleストリートビューからリアルなバーチャル3Dシーンを自動作成 Googleとトロント大が開発

                                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchとカナダ・トロント大学の研究チームが開発した「Urban Radiance Fields」は、Googleストリートビューなどのスキャンプラットフォームで取得できる情報を基に、複数の視点の画像から合成して作り出す新たな視点画像と3D再構成を自動作成する手法だ。 特定シーンの異なる角度から撮影した複数枚の画像を組み合わせる手法と違い、今回は常に動いているカメラから撮影する、スキャンプラットフォームの取得データ画像を入力に使う。そのため、常に変わるカメラ位置や太陽の位置、画像間の露出の変化、ほとんどの画像に映り込む空の画像の処理、同じ構造物でもカメラごとに色が異

                                                                            Googleストリートビューからリアルなバーチャル3Dシーンを自動作成 Googleとトロント大が開発
                                                                          • 「ExcelAPI」と新関数「IMAGE」を組み合わせたデモが早速お披露目/法人名を入れると、その法人番号・所在地とともに、所在地を「Google マップ」で表示【やじうまの杜】

                                                                              「ExcelAPI」と新関数「IMAGE」を組み合わせたデモが早速お披露目/法人名を入れると、その法人番号・所在地とともに、所在地を「Google マップ」で表示【やじうまの杜】
                                                                            • GitHub - google/magika: Detect file content types with deep learning

                                                                              Important We are about to release a number of new things, and they are ready for testing! We uploaded to pypi a release candidate for v0.6.0 (e.g., magika 0.6.0rc3), it's ready for testing! Please report any problems here: #798. You can install the latest release candidate with pip install --pre magika. A new ML model with support for 200+ content types. A new CLI written in Rust. This will replac

                                                                                GitHub - google/magika: Detect file content types with deep learning
                                                                              • Gemini 2.0 の 3D Spatial Understanding を試す|npaka

                                                                                「Gemini 2.0」の「3D Spatial Understanding」を試したのでまとめました。 ・Pointing and 3D Spatial Understanding with Gemini 2.0 (Experimental) 1. 3D Spatial Understanding「3D Spatial Understanding」(3次元空間認識) は、2D画像や動画から、現実世界の3次元空間を理解する能力や技術のことです。 【注意】3Dバウンディングボックスは実験段階です。精度を高めるには 2Dバウンディングボックスを使用してください。 2. Gemini API の準備「Google Colab」で Gemini API を準備する手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install -U -q goo

                                                                                  Gemini 2.0 の 3D Spatial Understanding を試す|npaka
                                                                                • Stable Diffusionのサンプルコード(text2img/img2img)をGoogle Colabで動かす方法

                                                                                  追記:簡単に動かせるNotebook作りました より簡単に動かせるColab Notebookを作っています。Hugging Faceのアクセストークンさえあれば、手軽にWebアプリ感覚で使えます。以下GitHubリポジトリのリンクからどうぞ。 解説ブログは以下です。 Stable DiffusionをGoogle Colabで動かす Stable Diffusion大人気ですね。公式が提供しているGoogle Colabノートブックで手軽に楽しむこともできます。 GitHubのStable Diffusionの公式のリポジトリを見ると、テキストから画像を生成するtext2img.pyの他ににも、画像からテキストの指示をもとに画像を生成(変換)するimg2img.pyなど色々なスクリプトがあります。 というわけで、これらのスクリプトをローカルPC無しでも自由自在に動かせるようなGoogle

                                                                                    Stable Diffusionのサンプルコード(text2img/img2img)をGoogle Colabで動かす方法

                                                                                  新着記事