・ビジネス書一冊分の金額 ・月に6〜8記事配信される新規記事の閲覧 ・過去に公開した100本以上の有料記事も読み放題 ・掲示板で記事化する前の思考や学びのメモ、登壇や取材での準備ログなどの裏側コンテンツを閲覧可能

こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi
やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love Apple「Apple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple」
ひたすら命令をチューニングして、カッコいいロボのコンセプトアートを作る実験。 以下、AIに平文で命令して作ったロボットのスタディ。(光やパーツ分割線は僕の趣味丸出しなので、これ系のロボットしか作れないわけではないです)。 建築合体ロボ建築合体ロボ巨人系 カラーにガンダムっぽさを意図的に出したもの。 要塞タイプ 超構造ストラクチャー型テラフォーミングロボ ボディースーツ型 死ぬほどワイヤーを巻きつけてったら、キングジョーっぽいシルエットになった。 多足非人間型 パワードスーツ系 通天閣的な建築物と合体したやつヘビーアーマー系Open-AIのDALL-E2、Disco Diffusion、MidJourneyなどなどから、自前のStyleGanやVQGan系を試したりClip系を試したり… 色々やって、よいパラメーターや命令の仕方がわかってきました。やはり、自分で実装やコードを見て、アルゴリズ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く