ブックマーク / ascii.jp (10)

  • 人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する (1/5)

    テキストによるプロンプト(指示)から精細な画像を生成する画像生成AI。無料もしくは安価で利用できる環境が増えるなか、「どのAIを利用すればいいの?」という疑問も自然と出てくる。 費用、手軽さ、描画速度など比較項目はいくつか考えられるが、やはりいちばん気になるのは“画風”ではないか。 もちろんプロンプトなどにより好みの画風にすることはある程度可能だが、モデルそれぞれの特徴や得意分野があるため、ある程度の傾向は存在する。 この記事は、現在注目を集める4つの主要な画像生成AIモデルに同じプロンプトを与えて生成された画像を比較することでそれぞれの傾向を明らかにし、モデル選択の助けになることを目的としている。 ※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpで配信中の記事をご確認ください 取り上げる4つのモデル それでは、記事で比較する4つのAIモデルを

    人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する (1/5)
    dystopian
    dystopian 2024/07/11
  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
    dystopian
    dystopian 2024/06/16
  • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

    筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

    まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
    dystopian
    dystopian 2024/05/14
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
    dystopian
    dystopian 2024/03/18
  • これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)

    これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 複数のUI環境のインストールや更新がワンクリックで可能に 画像生成AI「Stable Diffusion」をブラウザーで使うために必要なのがUI環境。筆者が入門したときは「Stable Diffusion WebUI(AUTOMATIC1111版)」しか選択肢がなかったが、現在は「ComfyUI」「Fooocus」「Stable Diffusion WebUI Forge」など様々な種類が出ている。 これらは基的に別のアプリケーションなので、それぞれ環境設定・インストールをする必要があり、パソコンの中に複数の環境が乱立しがちだ。 さらに、これらのUIで利用するモデル(Checkpoint)やVAE(高画質化ツール)、LoRA(追加学習モデル)などもUIごとに必要になる。シンボリックリ

    これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)
    dystopian
    dystopian 2024/03/13
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
    dystopian
    dystopian 2024/02/19
  • Stable Diffusionで画像からプロンプト(呪文)を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした (1/3)

    連載「Stable Diffusion入門 from Thailand」は、2024年に入って1回目。今年も「Stable Diffusion」をメインに、画像生成AI周辺の話題について入門者視点でお伝えしていきたい。 今回の話題は、Stable Diffusionを手軽に使えるユーザーインターフェースの「Fooocus」。12月13日にリリースされた新バージョン「Fooocus 2.1.831」には、画像をアップロードするとテキストプロンプト(呪文)を生成する「Describe」機能が追加されている。 画像をドラッグ&ドロップしてボタンを押すだけ

    Stable Diffusionで画像からプロンプト(呪文)を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした (1/3)
    dystopian
    dystopian 2024/01/17
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
    dystopian
    dystopian 2023/12/11
  • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

    画像生成AIStableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

    画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
    dystopian
    dystopian 2023/05/23
  • リスニング能力をひたすら鍛え上げられるサイト「ELLLO 」

    PCやスマホを使って、英語学習を時短にする便利なサービスやツールなどを紹介する連載。今回は、初心者から上級者まで、幅広くリスニング能力を向上できる「ELLLO」をご紹介します。 ELLLOは、「English Listening Lesson Library Online」の略で、読んで字のごとく、英語のリスニング学習に特化したオンライン学習サイト。3000以上という多くの無料のレッスンが用意されており、幅広いレベルの学習者が利用できる。もともと、日英語教師だったTodd Beuckens氏が創設したサイトで、2004年にスタートしたサイトだ。 メインの学習コンテンツは、ひたすら英語の音声を聞くというもの。スクリプトも用意されているため、聞き取れなかった場合も内容は把握できる。理想的なのは、スクリプトを見なくても聞き取れるようになることだ。 メインコンテンツとなるリスニングレッスンは、

    リスニング能力をひたすら鍛え上げられるサイト「ELLLO 」
    dystopian
    dystopian 2020/09/01
  • 1