A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team
画像生成AI「Stable Diffusion」は入力したキーワードに沿って画像を出力してくれるAIで、簡単なお絵かきとキーワードを合わせて意図した画像を生成したり、「この画像っぽい○○」といった指示でイメージを形にできたりと、さまざまな機能や手法が生み出されています。そんなStable Diffusionについて、「画像を学習するAIは、ウェブ上のどのような画像を学習しているのか?」という疑問を解明するために、23億枚のデータセットから1200万枚を抜粋して集計した調査結果を、技術者・ブロガーのアンディ・バイオ氏が公開しています。 Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion's Image Generator - Waxy.org https://waxy.org/2022/0
今話題の画像生成モデル「Stable Diffusion」をいらすとやの画像でfinetuneしてみたところ、任意のテキストに対していらすとやっぽい画像を作れるモデルが出来上がりました。 Stable Diffusionとは Stable Diffusionは、指定されたテキスト(文字列)に対応する画像を生成する機械学習モデルのひとつです。ソースコードと学習済みモデルは無償で公開されていて、誰でも利用できるようになっています。 (Stable DiffusionのGitHubページより引用) 今回は、この画像生成モデルをいらすとやの画像でfinetune(微調整)することで、入力テキストに対応する画像をいらすとやのようなスタイルで出力させることを試みました。 開発環境 開発環境はGoogle Colab Pro+で、主にプレミアムGPU(NVIDIA A100)を使いました。Stable
2022年8月にオープンソースで一般公開された画像生成AI「Stable Diffusion」は通常コマンドラインで入力や制御を行いますが、初心者でも簡単に操作できるStable Diffusion向けGUIが数多く登場しています。その中でもブラウザから使えるウェブUIであるAUTOMATIC1111版Stable Diffusion web UIは特に開発が活発で精力的に更新されており、もはや画像生成AI向けGUIの決定版ともいえる存在です。そのAUTOMATIC1111版Stable Diffusion web UIをAdobe PhotoshopやKritaから使えるようになるプラグイン「defuser」が公開されています。 defuser | the Stable Diffusion Plugin for Photoshop and Krita https://internatio
高精度な画像生成AI「Stable Diffusion」をブラウザから簡単に使うことができるウェブサービス「Mage」が登場しました。Mageはブラウザから直接アクセスして無料でStable Diffusionを使えるだけでなく、生成される画像に含んで欲しくない要素を指定するネガティブプロンプトの設定もできるほか、成人向け描写を規制するセーフティーフィルターも解除されているとのことで、実際に使い勝手を確かめてみました。 Mage 🧙 | Free, Fast, Unfiltered Stable Diffusion https://www.mage.space/ Mageのトップページにはプロンプトの入力フォームが表示されています。試しにプロンプトを入力し、矢印アイコンをクリックしてみると…… 数十秒ほどの待ち時間の後、Stable Diffusionによって生成された画像が表示されまし
Stable Diffusionの開発会社の代表者がアーティストを軽視する言動をしたということで、画像AIに関する時計の針が加速しそうな予感がしたので未来予測的なことを呟いてみる。なお、自分は法や規制の専門家という訳ではなく、AIの専門家ですらなく、単なる素人インターネットウォッチャーの予想であるということは先に明記しておく。 発端はnalgamiさんのこのツイート。 BBCがEmad Mostaque氏(Stable Diffusionの開発会社代表)への取材記事を公開。https://t.co/XxJruwMZTR 将来を心配する若手アーティストに向けて 「イラストやデザインの仕事はとても退屈。芸術的かどうか以前に君たちは道具(ツール)だよ。」 もう少しクリエイターに敬意を払うべきだと思うけどなぁ😢 https://t.co/vL8yAuANle — なるがみ (@nalgami)
人類の愚かさもいい加減にしろやと思ったので、世の中のツイートに対して思っていたことを書きます。既に突っ込み入ってるものが殆どですが、言いたくなったので言います。なのでまとまった文章ではないです。 ちなみに私の立場は以下です。 技術そのものに善悪はない。 なお、今回話題になっているAIは「技術」ではなく「技術の産物」 今回行われた学習は法的にはセーフだが、倫理的には善くない。 画像生成AIを利用した絵をそうでないものと区別しようとするのは愚か。 「これは何である」みたいな決めつけるような発言は愚か。 絵師にはもっと誇りとかないんか? 努力は報われてはいけない。 人類が愚かなのは昔から。 人の眼がもっと良くなるしかない。 例え話だけで納得するのは良くないと思う。 嘘をつくやつは何をやってもダメ。 いきます。 1. 人間が描いたイラストをAI絵師が勝手に学習データに利用するのを防ぐ方法はある。
From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 「Midjourney」や「Stable Diffusion」の登場により、より身近な存在となった画像生成AI。ついにはデザインツール「Canva」もAIによる画像生成機能を実装するなど、今後は実用化がますます加速していきそうだ。 Stable Diffusionを開発する英国のスタートアップStability AIは1億100万ドル(約150億円
ホーム ニュース 禅リラックス無限ドライブ『Slow Roads』PCブラウザ向けに無料公開。のどかな丘から火星まで無心で走る 個人クリエイターのAnslo氏は、『Slow Roads』を公開した。Webブラウザ上でプレイできる、ドライブゲームだ。 『Slow Roads』はドライブゲームだ。自動生成される道をひたすら車両で走り続ける。数種類の車両のほか、季節や時刻、天候なども複数用意。夜道をヘッドライトで取らしながら駆けることも可能となっている。 「終わりなきドライビング禅(Endless Driving Zen)」と銘打たれているように、本作は終わりも分岐もない道をひたすら車両で走り抜けていく。車両の運転はキーボード操作でおこなうほか、自動運転への切り替えも可能だ。鳴り響くのは電気駆動と思われる車両から響く音と、風を切る音のみ。心を無にする瞑想のようなゲームプレイが本作の特徴といえそう
「フェイク画像」「無断アップロード」撲滅なるか? ニコンが「来歴記録カメラ」を試作:Adobe MAX 2022 Adobeとニコンは10月19日、撮影した写真データに出所や来歴などの情報を付加することで真正性確認をしやすくする「来歴記録機能」をデジタルカメラに実装する取り組みを発表した。Adobeが10月18日(米国太平洋夏時間)から実施しているイベント「Adobe MAX 2022」のリアル会場では、この機能を試験実装した「Nikon Z 9」が展示されている。 アドビ(Adobeの日本法人)が10月19日に開催したイベント「Adobe MAX 2022 Japan」のリアル会場でも、来歴記録機能を試験実装したNikon Z 9が展示されていたので、この記事で紹介する。 来歴記録機能の概要 写真(静止画)や動画がデジタルデータとなり、これらを編集するアプリが高機能化したこともあり、最近
10月6日、NovelAIのGitHubとかのプライベートリポジトリに第三者が侵入して、AIモデルやソースコードを丸っと盗んで流出させた。 [Announcement: Proprietary Software & Source Code Leaks] Greetings, NovelAI Community. On 10/6/2022, we experienced an unauthorized breach in the company's GitHub and secondary repositories. The leak contained proprietary software and source code for the services we provide. — NovelAI (@novelaiofficial) October 7, 2022
8月には「Midjourney」や「Stable Diffusion」といった画像生成AIが世間を驚かせた。特にStable Diffusionは、Photoshop用プラグイン(非公式)に組み込まれるなど活用も進んでいる。 9月は、引き続き画像生成AIが話題に乗り続けたが、それ以上に音声合成AIがバズった。本記事では9月に登場して話題になったAIや、関連するニュースをまとめる。 「AIひろゆき」登場 無料で適当なことを喋らせられる 音声合成AIを開発するCoeFont(東京都港区)が、匿名掲示板「2ちゃんねる」の開設者として知られる西村博之(ひろゆき)さんの声を再現するAIサービス「おしゃべりひろゆきメーカー」を無料公開した。 <「AIひろゆきに適当なことを喋らせよう!」 無料のジェネレーター公開 本人公認> 140文字以内のせりふを入力して合成ボタンを押すと、ひろゆきさんが喋っているか
英字新聞社ジャパンタイムズ、スタートアップメディア・テッククランチでの記者経験を経て、ダイヤモンド社のスタートアップ担当記者に。最近はフードテックやモビリティ領域に注目している。趣味はギターやシンセサイザーだが総じて下手。2020年7月よりダイヤモンド社「DIAMOND SIGNAL」記者。 From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 本記事では、インタビュアーを担当したTHE GUILD・
話題のStableDiffusionがオープンソースで8/23に公開されたので、手元のマシンで動かすまで試したいと思います🖼 (下記に記載していますが、自分の環境だとVRAMが不足しているエラーが出てしまったのでイレギュラーな対応をしています🙏) ※ ↑追記 コメント欄にて、 @kn1chtさんが紹介してくださっているように、マシンのVRAMが10GB未満の環境では半精度(float16)のモデルがオススメされています。 本記事では、別の最適化されたものを紹介していますが、こちらの利用も検討してみると良さそうです👉 https://zenn.dev/link/comments/7a470dc767d8c8 StableDiffusionがどんなものかは、深津さんの記事が参考になります。 1. 環境 Razer Blade (RTX 2070, VRAM 8GB) CUDA Toolk
筆者が絵描きAI「Midjourney」に描かせた風景。「Sustainable Development Goals」をテーマに指定した。 作成:清水亮 ここのところ、Twitterなどで“神絵を描くAI”こと「Midjourney」が、話題になっている。一瞬で神のように上手な絵が描けると話題になり、またたく間にネットのミームになった。 「絵を描くAI」というと、イーロン・マスクらが出資したことでも知られるAI研究企業、米OpenAIの画像生成AI「DALL-E2」が有名だが、グーグルは今年に入ってからDALL-E2の性能を上回る「Imagen」を発表し、さらに大規模な作画AI「Parti」も矢継ぎ早に発表している。 Midjourneyはこれら画像生成AI開発ブームの一端として生まれたとも言える。 この記事では、全3回の短期集中連載として、AI研究者目線で見た「Midjourney」の課
各所で話題を呼んでいる「AI画像ジェネレーター」 のMidjourneyは、社員数わずか10人の会社によって運営されている。作者のデイヴィッド・ホルツは会社を「自己資金で運営される研究所」と形容しており、すでに利益が出ているという。資金力が物を言う分野で異色の存在だ。 Midjourneyは「テキストを入力するとAIが画像を出力してくれるサービス」で、現在、SNS上にはMidjourneyが生成した画像が溢れている。Midjourneyはチャットサービス「Discord」を通じて利用できる。新規ユーザーはDiscordのMidjourneyサーバーにログインし、様々な初心者チャンネルで他の多くのユーザーと一緒に画像を生成するためにテキストを送信できるのだ。 月額10ドルまたは30ドルの定額制にアップグレードすると、Discordアプリ内のMidjourneyボットにプライベートなダイレクト
より良く、よりカスタマイズ可能なウェブサイト: Holara AI 創造性 コントロール 0.5 より高い創造性の値は、AIがより創造的で詳細であるだけでなく、乱雑で奇妙であることを示します 速度 コントロール 1.5 スペースキー: 一時停止, 引っ張る: グリッドを移動, クリック: 新しいタブで画像を開く F: フルスクリーンモード, Z: ホバーでズーム, V: ビデオモード アニメとAIに関する最新情報はTwitterで見つけることができます クリエイター: aydaoはAIモデル, nearcyanはウェブサイト, obormotはJS, gwern (TWDNE), arfa (TFDNE, TPDNE), shawwn, skyli0n, tensorfork, TFRC からの助け 情報: このウェブサイトについて, 詳細な記事 ダウンロード: 画像など
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く