Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold Drag Your GANはSIGGRAPH 2023 Conference Proceedingsのグラフィックカンファレンスで発表された画像の1点から別の場所に目標位置を移動させる事で1つのポイントを維持しながら画像を制御出来るようになる機能が発表されました。 実際に使用している参考動画では、1枚の画像に赤いポイントと青いポイントを配置してボタンを押す事でライオンの顔の位置を変更したり、閉じてるライオンの口を開けたりする様子を確認する事が出来ますが、その他に人間が着ている洋服を伸ばしたり、自然の景色に写っている山だけを下げたり、車の角度を変更したりしている参考動画をリンクページから確認する事が出来ます。 Photosh
他にも「LatentMajestyDiffusion」「centipidediffusion」「latenddiffusion」「discodiffusion」「dalle2」など存在します。アルゴリズムが違うと同じ呪文でも質の違う画像が生成されるので、気が向いた人は色々と試してみることをお勧めします。 画像生成に関する基本知識画像生成に関するベーススキルは、どんなものを生成する場合でも一緒なので、上級錬金術師に学ぶのが一番早い。参考をいくつか紹介します。 大原則となる考え方を深津さんのnoteから抜粋します。 対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 だからAIをよく使役するには、2つの理解「ベクトルの方向を強く適宜する力ある言葉ルーンの語彙力」と「再現性をもった呪文の組み立て」が必要になる。 深津さんのnote「魔術として理解するお絵描き
筆者が絵描きAI「Midjourney」に描かせた風景。「Sustainable Development Goals」をテーマに指定した。 作成:清水亮 ここのところ、Twitterなどで“神絵を描くAI”こと「Midjourney」が、話題になっている。一瞬で神のように上手な絵が描けると話題になり、またたく間にネットのミームになった。 「絵を描くAI」というと、イーロン・マスクらが出資したことでも知られるAI研究企業、米OpenAIの画像生成AI「DALL-E2」が有名だが、グーグルは今年に入ってからDALL-E2の性能を上回る「Imagen」を発表し、さらに大規模な作画AI「Parti」も矢継ぎ早に発表している。 Midjourneyはこれら画像生成AI開発ブームの一端として生まれたとも言える。 この記事では、全3回の短期集中連載として、AI研究者目線で見た「Midjourney」の課
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く