タグ

ブックマーク / ascii.jp (35)

  • AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (1/5)

    グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグル画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。 ※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです フィルターはとても厳しく、女性を出すのは難しい ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に

    AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (1/5)
    snaflot
    snaflot 2024/09/16
  • 画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に (1/5)

    画像生成AI「Stable Diffusion」開発者たちが突然発表した新モデル「FLUX.1」、これが楽しすぎてはまりこんでいます。私の業はゲーム会社。出展を予定している東京ゲームショウまで1ヵ月で、やらないといけないことが山積みなのに、FLUX.1が面白すぎて魅力に抗えません。 わずか30分の学習で画風が安定 FLUX.1が決定的に変えてきそうなのはLoRAです。LoRAは学習済みのウェイトモデルを利用することで、少ない枚数であっても学習ができるということで、画像生成AIの分野では広く普及している手法です。FLUX.1は、Stable Diffusionで使われてきたLoRAの方法論を動かすことができることがわかっています。 そのため、FLUX.1のリリース後、ユーザーコミュニティーでさっそくLoRAの環境の整備が始まり、何ができるのかを試すフェーズに入っています。これまでの「Sta

    画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に (1/5)
    snaflot
    snaflot 2024/09/02
  • 「リアルすぎる」と話題 グーグル画像生成AI「ImageFX」の使い方

    グーグルは8月28日、Geminiの画像生成AIモデルとして、リアルな表現に強い最新の「Imagen 3」を採用した。この記事ではそんなImagen 3を、Geminiを経由せず、ブラウザーから手軽に利用できるサービス「ImageFX」の使い方をご紹介する。 ※ 記事ではPCからの利用を前提に説明しており、スマートフォンやタブレット等では画面の構成やボタン類の配置などが異なる可能性があります。あらかじめご了承ください。 Googleアカウントがあれば無料で利用可能 ImageFXグーグルが公開している実験的な画像生成サービス。Googleアカウントでのログインは必要だが、無料で使うことができる。

    「リアルすぎる」と話題 グーグル画像生成AI「ImageFX」の使い方
    snaflot
    snaflot 2024/08/31
  • 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6)

    画像生成AI「Stable Diffusion」共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」が、8月1日(現地時間)に発表した話題の画像生成AIモデル「FLUX.1」。 前回の「画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した」では、「ComfyUI」による画像生成を試した。 今回は、この連載ではおなじみ「Fooocus」の作者lllyasviel氏によるStable Diffusion用の高性能なWebインターフェース「Stable Diffusion WebUI Forge」が8月11日頃にFLUX.1に対応したということで、さっそく動作確認してみる。 なお、筆者の環境は以下のとおりだ。 CPU

    話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6)
    snaflot
    snaflot 2024/08/18
  • 画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)

    Stable Diffusionの共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」が8月1日(現地時間)に発表した最新の画像生成AIモデル「FLUX.1」。画像生成アプリ「ComfyUI」が対応を発表しているので、ローカル環境で動くかどうかを試してみた。 画像生成AIは「Midjourney」「Stable Diffusion」「DALL-E」の三つ巴 現在、画像生成AIの分野は主に「Midjourney」、「Stable Diffusion」、「DALL-E 3」の3つがそれぞれ独自のアプローチでユーザーを集めている。 Midjourneyは直感的なインターフェースと美しい芸術的な出力で知られ、主にクリエイティブな専門家やアーティストに人気がある。 一方、Stable Diffusionはオープンソースの柔軟性と強力なカスタマイズ能力で、技術

    画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)
    snaflot
    snaflot 2024/08/08
    “FLUX.1 [pro]はAPIのみを通じて提供され、商用利用も可能な最高性能のモデル。プロンプトの追従性、ビジュアルクオリティー、画像のディテール、出力の多様性など、最先端のパフォーマンスを備えた画像生成を提供”
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
    snaflot
    snaflot 2024/07/02
  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
    snaflot
    snaflot 2024/05/27
    拡張機能“ComfyUI-IC-Light”
  • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

    画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

    画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
    snaflot
    snaflot 2024/05/10
  • 画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

    画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

    画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
    snaflot
    snaflot 2024/03/18
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
    snaflot
    snaflot 2024/02/26
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
    snaflot
    snaflot 2024/02/19
    “「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー”
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
    snaflot
    snaflot 2024/02/16
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (2/5)

    アドビの台頭と「AIグラビア」問題 画像生成AIが話題になるなか、大手企業として格的に入ってきたのがアドビ。3月22日に「Adobe Firefly」のベータ提供を開始し、話題になりました(一般提供開始は9月)。 いまだにFireflyの課題としてあるのは、1024×1024ピクセルでの画像しか生成できないこと。大きな画像サイズの場合は生成した画像をアップスケールしているようで、レスポンスは早いものの、画面の端がぼやけてしまうという難点があります。実際にプロが使いはじめると、スケールが小さすぎて使いものにならないことが課題になっています。 おそらくアドビは今後、毎月付与される有料ポイントを使うとディテールを高めるといったオプションを作るのではないかと予想されています。 とはいえ、現状でも削除機能は非常に優秀で、業務のなかでは頻繁に使う機能になりました。要らないものをまとめて消したり、画面

    画像生成AIが爆速で進化した2023年をまとめて振り返る (2/5)
    snaflot
    snaflot 2023/12/11
  • 画像生成AIに“表現の自由”を スーパーハッカーが挑んだ「Fooocus」 (1/4)

    Fooocusの画面から「girl」で生成した直後。スタート画面では当に設定項目がほぼない(画像は筆者生成) Stability AIは7月27日、2週間遅れで「Stable Diffusion XL 1.0(SDXL)」をリリースしました。現在、SDXLに対応した動作環境として主要なものとしては「WebUI(A1111版)」、「ComfyUI」の2つがあり、このうちComfy UIの対応が早かったため人気になっています。Stablity AIでは「StableSwarmUI」というWebUIの公式版といった形の動作環境を作っていて、ComfyUIとの統合を進めています。 その一方、SDXLが出てきたことでWebUI、ComfyUI、StableSwarmUIはだんだん導入のハードルが上がってきてしまいました。事前に設定しなければならない要素が多く、求められる専門知識が着実に上がっている

    画像生成AIに“表現の自由”を スーパーハッカーが挑んだ「Fooocus」 (1/4)
    snaflot
    snaflot 2023/12/11
  • GPT-4搭載したマイクロソフトEdge「Copilot」の使い方

    マイクロソフトはWordやExcelなどのビジネススイーツ「Microsoft 365」に、OpenAIの「GPT-4」をベースに採用した新「Microsoft 365 Copilot」を発表している。Copilotとは副操縦士という意味で、ユーザーがPCでする作業を支援するのが特徴だ。GPT-4の技術を利用し、チャット形式で指示することで様々なことができるようになる。 今後、数ヵ月のうちに搭載されるとのことだが、実はEdgeアプリにはすでにCopilotが搭載されている。以前、新しいAI検索エンジンについて紹介したが、さらにブラッシュアップされているので、使い方を紹介する。 EdgeのCopilot機能でほしい答えを瞬時に入手する方法 Edgeの右上にあるBingアイコンをクリックすると、Copilotのサイドバーが現れる。今回は、文章を執筆する機能を試してみよう。「作成」タブをクリック

    GPT-4搭載したマイクロソフトEdge「Copilot」の使い方
    snaflot
    snaflot 2023/05/01
  • 緒方恵美さん「逃げちゃダメだ」――コロナ禍によるライブエンタメ業界の危機を語る (1/5)

    声優そしてアーティストとして長年音楽活動を続けている緒方恵美さん、そして緒方さんの音楽活動をサポートするランティスの吉江輝成プロデューサーに、コロナ禍におけるライブエンターテインメントの実情を伺った <後編はこちら> 緒方恵美さんが語る、ライブ業界の現状 緒方恵美さんは『新世紀エヴァンゲリオン』碇シンジ役などで知られる人気声優だ。現在でも『ダンガンロンパ』『花子くん』等で主役を演じ、声優として最前線を走り続けるトップランナーでもある。 一方で、音楽活動のキャリアも長い。2000年代からはランティスに在籍し、ロックを中心にオリジナル楽曲を制作、全国ツアーを回るアーティストの顔も持つ。 近年では事務所を設立し、経営者となった緒方さん。新型コロナウイルス感染拡大防止策に端を発した音楽業界の危機に直面し、演じる側と支える側の苦境を両方一度に味わった。 「このままではかなりの音楽関係者が仕事を辞めざ

    緒方恵美さん「逃げちゃダメだ」――コロナ禍によるライブエンタメ業界の危機を語る (1/5)
    snaflot
    snaflot 2021/04/25
  • 次の技術ブログを狙う「Zenn」がクラスメソッドへ 改めてエンジニアの情報発信を問う (1/3)

    クラスメソッドがエンジニア技術情報発信サービスである「Zenn(ゼン)」を買収する。自らもエンジニア向けの技術情報発信メディア「Developers.IO」を運営するクラスメソッドが、なぜZennの運営に乗り出したのか? 数十社による争奪戦の舞台裏とは? そして今後目指す情報発信の姿とは? Zenn開発者のcatnose氏とクラスメソッドの横田聡CEOに聞いた。(以下、敬称略 インタビュアー アスキー編集部 大谷イビサ) 既存のブログサービスでは満足できなかった オオタニ:まずはcatnoseさんからZennの開発経緯を聞かせてください。エンジニア技術情報発信って、それこそ個人ブログもあるし、最近ではQiitaがメジャーだったりして、決して真新しくはないですよね。あえて、この分野にチャレンジした背景を教えてください。 catnose:もともと私は個人でWebメディアをやっていて、十分

    次の技術ブログを狙う「Zenn」がクラスメソッドへ 改めてエンジニアの情報発信を問う (1/3)
    snaflot
    snaflot 2021/02/01
  • アップル、iPad mini 5を発表か

    アップルは10月30日の発表会で新型iPad mini――iPad mini 5を発表する可能性がある。アップル関連の著名アナリスト、ミンチー・クオ氏がその予測を10月23日に発表した。 iPad mini 5にはアップグレードされたプロセッサーと低コストの液晶パネルが採用される。クオ氏によると、アップルはiPad mini 5を今月の発表会か2019年前半までに発表するという。 そのほかクオ氏は今月の発表会でAirPowerやAirPodsも発表される可能性があると伝えている。

    アップル、iPad mini 5を発表か
    snaflot
    snaflot 2018/10/25