こんにちは。だだっこぱんだです。 今回は、AIイラスト界隈で最近話題のControlNetについて使い方をざっくり紹介していきます。 モチベが続けば随時更新します。 StableDiffusionWebUIのインストール今回はStableDiffusionWebUIの拡張機能のControlNetを使います。 WebUIのインストールに関してはすでにいろんな解説記事や動画があると思うのでそちらをご参照ください。 一応僕が作った簡単にWebUIを起動できるソフトも紹介しておきます(せんでん)
こんにちは。だだっこぱんだです。 今回は、AIイラスト界隈で最近話題のControlNetについて使い方をざっくり紹介していきます。 モチベが続けば随時更新します。 StableDiffusionWebUIのインストール今回はStableDiffusionWebUIの拡張機能のControlNetを使います。 WebUIのインストールに関してはすでにいろんな解説記事や動画があると思うのでそちらをご参照ください。 一応僕が作った簡単にWebUIを起動できるソフトも紹介しておきます(せんでん)
もしも、フォトショップをつかって、写真から不要な人やものを消したいとき、あなたならどうしますか。 さまざまな方法がありますが、もっとも手軽なのが「コンテンツに応じた塗りつぶし」でしょう。 シンプルな写真では問題ないのですが、特に複雑な写真では、フォトショップにあまり良い結果を期待することができません。 今回は、フォトショップと無料のAIツールをつかって、どんな写真でも不要な人やものを消す新しい写真加工テクニックをご紹介します。 フォトショップ「コンテンツに応じた塗りつぶし」の現状 まずは、フォトショップの「コンテンツに応じた塗りつぶし」をつかって、どこまで消せるか試してみます。 こちらの写真の手前に立っている男性を、消してみましょう。 加工をはじめる前に、もとの写真をコピーして保存しておくと、もしものときのバックアップになります。 ここでは、「被写体の選択」ツールを使い、人物のみを切り抜き
20220804酷暑がすごすぎる。夜10時とかに外にいても熱中症になると思った。しゃれにならない。今日は天気が悪く、暑さも小休止でしょうか。今日だけなのか。 Midjourneyの感触(詳しくはあらためて)御存知の通り、Midjourneyを結構使いはじめました。このMidjourney、詳しくはまた個別記事でまとめることになると思うが、小説媒体には特に相性が良いと感じた。 もともと小説は「文章をもとにイメージを喚起するコンテンツ」なので、小説の挿絵というのは、マンガやアニメの絵とは本来、質を異にするものだ。キャラデザのディテールとかは、必ずしも絶対必要なクリティカルなものではない。 昔のファンタジー小説とかの挿絵を見ると、実際かなりアブストラクトな感じである事がわかると思う。わりと、線とかがビュンビュンしていて、はっきりした形がなかったりもする(そしてそれによってイマジネーションが邪魔さ
「なぜ見抜けなかったのか」 画像の選択を迫られるたびに俺は自問する。 進化の筋道を正しく予測するのは難しい。 遺伝的アルゴリズムの活用 2021年から、新たに習慣となった行為はあるだろうか。俺はある。PCの前に座り、二つの画像のうち、どっちの方がエッチかを選ぶ。これがモーニングルーティンとなっている。もちろんこれの話だ。 遺伝的アルゴリズムで最高にエッチな画像を作ろう! これまで何度も話題になっていたし、直近でも関連ツイートがバズっていたので、本記事を読む人の大半は知っているだろう。名前の通り、遺伝的アルゴリズムでエッチな画像を作るシステムである。人が画像を選択することで、よりエッチな画像が生き残り、高みへと一歩近づく。最初はノイズのようなモザイク画だったが、10,000世代を超えた現在では「女性の裸体」と認識できるものに仕上がっている。 0世代と10,000世代 現状について「最高にエッ
マサチューセッツ工科大学(MIT)のコンピューター科学人工知能研究所(Computer Science and Artificial Intelligence Laboratory、CSAIL)は、音楽を演奏するムービーから特定の楽器の音を分離する人工知能(AI)システム「PixelPlayer」を開発しました。このシステムを使うと、ムービー上の演奏者をクリックするだけでその楽器の音だけを抜き出したり、音量を調整したりできるようになるとのことです。 The Sound of Pixels http://sound-of-pixels.csail.mit.edu/ 「PixelPlayer」はムービーに映っている楽器をピクセルレベルで識別したり、その楽器に関連付けられた音を抽出したりすることができます。人間が追加で操作することなく映像と音楽を同時に解析・同期し、映像の中で演奏している人と音声
「新小売(ニューリテール)」が台頭、中国は新たな小売業の在り方を模索 中国の小売市場は相変わらず、2桁成長を維持している。このうち、EC市場が占める割合は年々伸びているが、リアル小売業は横ばいとなっており、相対的には厳しい状況だ。 郷氏は、過去3年間の中国動向を「2015年から格安スマートフォンが普及し、消費者起点の新しいサービスが始まった。2016年にオンライン事業者大手のBAT(バイドゥ、アリババ、テンセント)がサービス業のM&Aを進め、小売業を超えたオムニチャネル経済圏を構築した。2017年には、既存業態から脱却し、業界や国内外の壁を超えたマルチ・ボーダレスの時代へ突入した」と振り返った。 さらに2017年からは、従来の業態とは異なる「新小売」モデルが登場し、新たな小売業の在り方が模索されるようになったという。アリババのジャック・マーCEOの言葉を借りれば「スーパーや百貨店などの伝統
フリー素材サイト「いらすとや」に出てくる人間風の画像を自動生成するモデルをDeep Learningで作りました。実装にはGoogle製のライブラリ「TensorFlow」と機械学習アルゴリズムの「DCGAN」「Wasserstein GAN」を用いています。 以下は生成された人間画像のうちそれなりにきれいなものの一例です。頬のところが赤くなっていて何となく本家いらすとやの特徴を捉えられていると思います。 「いらすとや」とは? 実装した手法の概要 DCGAN、Wasserstein GANについて Generator Discriminator GeneratorとDiscriminatorの学習 学習や実装の詳細 Generator、Discriminatorのネットワーク構成やパラメーター 訓練データ その他 学習経過 モデルを検証する 入力にバイアスを掛けていい画像を出やすくする ま
人工知能(AI)そのものではないのですが、その人工知能を稼働させるためのデータを整備する会社にいくつか投資をしている関係で、昨今の「なんでも人工知能が問題を解決してくれる」的なネタに敏感になってきました。 まあ、一言で言えば「それができたら苦労しねえよ」って話で。 「人工知能」のような大きい言葉で騙しに行く「仕組み」 先日も、某大新聞が「6000サンプルを参考に、新卒大学生の採用試験を人工知能に任せることにしました」的な報道を大々的にして、いわゆる人事評価や採用のデータを取り扱うサイエンス系が「そんな話、どこにあるの?」と騒然としたわけです。また某大手通信会社の薄毛社長が人工知能に投資して採用に活かすみたいな発言をしていたので、なんか私たちも知らないような凄い統計学バックグラウンドの秘伝のタレでもあるのかと思ってました。 蓋を開けてみれば、単純に大学生が企業の採用面接を受ける際のエントリー
「スゲー。これが今の日本の技術か……」 「世間はここまで進歩していたのか」 開発したのは、兵庫県西脇市に本社を置くシステム開発会社・ブレイン。創業35年、いまも社員20人のうち約16人がエンジニアという、生粋の技術者集団だ。 約10年前にゼロから開発スタート マシンの名前は「BakeryScan」(ベーカリースキャン)。「お店に提供を始めたのは今から4年ほど前。最近になって突然『ネットですごい反響がある』と人に言われて驚いた」――ブレインの原進之介執行役員はこう話す。 BakeryScanの開発が始まったのは2008年にさかのぼる。きっかけは、地元・兵庫県のパン店社長から相談を受けたことだった。 「人が足りなくて困っている。経験の浅い外国人スタッフでもレジ打ちや接客ができるようなシステムを作ってほしい」――。 だが、同社のパンに関する専門知識はゼロ。そこから待ち受けていたのは、約6年にわた
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く