![https://twitter.com/Yamkaz/status/1626486302962245633](https://cdn-ak-scissors.b.st-hatena.com/image/square/95b21351e4507d594100f1fc08786fcd3a903d6d/height=288;version=1;width=512/https%3A%2F%2Fpbs.twimg.com%2Fmedia%2FFpJv6COaUAAn25l.jpg)
2月17日、「AIコスプレイヤー」というワードがTwitterトレンドに入った。話題のAIイラスト生成技術で作られた実在しないコスプレイヤーのイラストをインフルエンサーが拡散。写実的な画風やセクシーさも相まって「もう人間はいらないのでは」「コスプレと関係ない」などと賛否両論の声が出ている。 実際に画像を見てみると、確かにセクシーかつ、一瞬写真と見間違えるようなクオリティーだ。よく見るとおかしな点はあるが、ぱっと見はよくあるグラビアアイドルやモデルの写真とそっくりに感じる。 果たして、どうやって作ったんだろう──そう思って作り方を調べてみたところ、記者のような文系・非ITエンジニアでも似たようなものが生成できそうなことが分かった。一方で、その生成過程にはインモラルな“無規制地帯”が関わっていることも見えてきた。 AIコスプレイヤーの作り方 必要なのは…… そもそも話題のAIコスプレイヤーはど
1.はじめに 今までテキストから画像生成するモデルは、テキストで指定して特定のオブジェクト(有名なものを除く)を画像生成することが困難でした。 今回ご紹介するのは、テキストから画像を生成するモデルを、特定のオブジェクトの画像(3〜5枚程度)でファインチューニングすることによって、テキストで指定して特定のオブジェクトを画像生成できる Dream Booth という技術です。 *この論文は、2022.8に提出されました。 2.Dream Boothとは? 下記がDream Boothのフロー図です。3~5枚の画像(Input Images)を使って、テキストから画像を生成するモデルを2ステップでファインチューニングします。 第1ステップ(左図)はモデルの低解像度部分が対象です。ユニークな識別子を含むテキスト(”A[V]dog”)を入力したら入力画像(Input Images)を出力するように、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く