タグ

ブックマーク / ascii.jp (129)

  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
  • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

    筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

    まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
    harumomo2006
    harumomo2006 2024/05/14
    これにホログラムと音声を付けたら完全に未来が来る
  • 画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

    画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

    画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)
    harumomo2006
    harumomo2006 2024/03/25
    もうちょっとだな
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
  • ChatGPTで画像生成するならコレ! おすすめGPTs紹介 (1/6)

    OpenAIは1月10日、カスタムバージョンのGPTを作成できる「GPTs」機能で作成した多様なGPTを探索できる「GPT Store」の公開を予告通り開始した。今回はストアーのラインアップから画像生成系の「DALL·E」カテゴリーを取り上げてみよう。 「DALL·E」カテゴリー 「DALL·E」カテゴリーには言うまでもなくOpenAI画像生成AI「DALL·E 3」を便利に使うために作られたカスタムGPTが掲載されている。今回は上位6個のGPTを使ってみることにする。 まずは「DALL·E」カテゴリーのトップ「image generator」というGPTを試してみよう。説明欄には「プロフェッショナルかつフレンドリーなトーンで画像を生成し、洗練させることに特化したGPT(A GPT specialized in generating and refining images with a

    ChatGPTで画像生成するならコレ! おすすめGPTs紹介 (1/6)
  • 女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?

    ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られた いままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。 彼女は X(Twitter)の自分のアカウントで1日1のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな!」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。 目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

    女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
  • もはや稀少種だけど根強い人気の16:10ディスプレー、選ぶなら2万円台でUSB Type-C給電対応のコレ (1/5)

    現在発売している液晶ディスプレーの多くは、解像度が1920×1080ドットや3840×2160ドットなどのアスペクト比16:9のモデル。これは動画やゲームといったコンテンツの多くがその比率であることが多く、それに呼応する形で液晶ディスプレーも増えてきたからだ。 しかし、動画やゲーム以外の用途では、16:9が最適と感じないこともある。例えば、オフィスアプリケーションで、画面の縦方向が少し足りないと感じたことはないだろうか。その不満にこたえてくれる製品が、今回紹介するJAPANNEXTの24型ディスプレー「JN-IPS24WUXGAR-C65W-HSP」だ。 駆動方式はIPSを応用したADS、sRGBカバー率は99% JN-IPS24WUXGAR-C65W-HSPは光沢のない、いわゆるノングレアタイプで、アスペクト比は16:10、解像度は1920×1200ドットとなる。駆動方式はIPSだが、正

    もはや稀少種だけど根強い人気の16:10ディスプレー、選ぶなら2万円台でUSB Type-C給電対応のコレ (1/5)
    harumomo2006
    harumomo2006 2024/02/12
    昔使ってたDELLのノートが1920x1200の17インチでとても使いやすかった。1920x1080に乗り換えたらメニューの下が切れて使いづらいソフトが出てきて焦った
  • “生成AIゲーム”急増の兆し すでに150タイトル以上が登録 (1/4)

    1月10日、PCゲーム配信プラットフォーム「Steam」運営元の米Valveが、生成AI技術を使ったゲームを認める形で方針を変更しました。今回の変更では「AI技術を使用するゲームの大半がリリース可能」になるとしており、これまで事実上の禁止と受け止められていた状況からすると大きな方針転換です。ゲーム業界では生成AIの導入が進みつつありますが、生成AIに反対するユーザー、開発者自身の懸念などをはらみつつ進んでいます。すでにSteamでは159ものタイトルが登録済みと急激に増加しつつあります。 Steamのレギュレーションでは、AI生成を「事前生成」と「ライブ生成」の2つに分けています。 「事前生成」では、ゲーム開発会社は生成AIに関する開示セクションが追加され、どのように生成AIを利用しているのかをタイトルの販売申請時に記入する必要があります。 アート、コード、サウンドなどを使用して作成された

    “生成AIゲーム”急増の兆し すでに150タイトル以上が登録 (1/4)
    harumomo2006
    harumomo2006 2024/01/29
    他の業種でもAI化は進んでるし当然の流れかな
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
    harumomo2006
    harumomo2006 2024/01/22
    現実世界も一貫性が無い人多いから意外とリアルっぽさはあるかも
  • 「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

    AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG

    「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
  • 商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)

    AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AIEmi(Ethereal master of illustration)」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。 「Stable Diffusion XL(SDXL)」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。 なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。 モデルをダウンロードして指定フォルダーに入れるだけ まずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待と

    商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)
    harumomo2006
    harumomo2006 2023/10/01
    そりゃノイズからランダム生成してるんだから当たり前だろうとしか>シンプルなプロンプトから実在のキャラクターに似た画像が生成されることはあった
  • 深刻なアニメの原画マン不足「100人に声をかけて1人確保がやっと」 (1/3)

    頻発したアニメ放送配信の延期、デジタル化と制作進行、アニメ業界で求められる人材……TRIGGER取締役・舛和也さんにうかがった ■アニメ業界の働き方改革は「ファイル共有」から始まった!? 前編に引き続き、アニメスタジオ「TRIGGER」の取締役・舛和也さんをお迎えして2023年2月に生配信したインタビューを再構成してお届けします。 ◆ まつもと では、2つ目のコーナーにいきたいと思います。昨今、アニメの制作工程は変化していますし、これからも変化が必要であるという状況にあります。 舛さんはアニメの制作進行を目指す人向けのを星海社さんから出版されていますし、同じテーマで同人誌も精力的に発表しています。 制作進行と言われて我々がイメージするのは、アニメ『SHIROBAKO』で描かれたようなスタイルですが、それが変わってきている、あるいは変わらなきゃいけない、というようなお話もこのコーナー

    深刻なアニメの原画マン不足「100人に声をかけて1人確保がやっと」 (1/3)
  • 米国速報:Windows11が9月26日に「Copilot」を正式搭載で150を超える新機能&新Surfaceも!

    米マイクロソフトは、現地時間9月21日に発表会を開催し、26日にWindows11の最新アップデートをおこない、AIツール「Copilot」を正式に実装すると発表。同時にSurfaceの新モデルも公開した。 Copilotは、9月26日からWindows11への無料アップデートの一部として提供され、今秋には Bing、Edge、Microsoft 365 Copilot にも展開される。公開されるWindows11は150を超える新機能を備え、Copilotのパワーと、ペイント、フォト、ClipchampなどのアプリにAIを活用した新機能が加わる。 ○Copilotのプレビュー版は常にタスクバー上に表示されるか、Win+Cショートカットを使用して起動可能となる。 ○ペイントアプリでは、生成AIによるCocreatorのプレビューに加え、背景の削除とレイヤーが追加され、画像作成にAIが活用で

    米国速報:Windows11が9月26日に「Copilot」を正式搭載で150を超える新機能&新Surfaceも!
  • データセンターの所在地ってやっぱり書いてはいけないのか?

    いろいろなところからマサカリが飛んでくるのはわかっているが、以前から感じていた疑問について書いてみたい。「データセンターの所在地ってやっぱり書いてはいけないのか?」である。だって、ググれば所在地は出てくるんですよ。いろいろ秘密の多いデータセンターだが、インフラ界隈での内輪受けみたいな感じになっていやしませんかね。 実は制約の多いデータセンター取材 ITインフラ系の記者は、たまにデータセンター見学ツアーに招待される。エクイニクスやさくらインターネット、NTTコミュニケーションズなど、私も相当データセンターは見ている方だ。Coltテクノロジー(旧KVH)はシンガポールまで、IIJはコンテナ型データセンターを見に島根まで行っている。IDCフロンティアに至っては北九州も、白河も、府中も見ている。 5月には大阪までデジタルエッジのデータセンターを見にいった。関西のデータセンター事情までいろいろ説明し

    データセンターの所在地ってやっぱり書いてはいけないのか?
    harumomo2006
    harumomo2006 2023/07/29
    そんなことより法人格を持たない人の特定商取引法の住所公開はやめてほしい。マンションの光ファイバーケーブル切られて廃業に追い込まれた人もいるし物騒なことこの上ない