colonoeのブックマーク - はてなブックマーク

人が絵を描く“工程”をAIで再現　タイムラプス風動画が炎上した「Paints-Undo」 (1/4)

7月9日、イラストが完成するまでの過程を生成できる画像生成ツール「Paints-Undo（ペイントアンドゥ）」が発表され、騒ぎとなりました。話題となったのは、人間がイラストを描いている様子をタイムラプスでとらえたかのように見えるデモ動画です。これが大きな反響を呼び、特に日本では"炎上”ともいえる状態になりました。日本では「タイムラプス動画を記録しておけば、“人間が描いた”と証明することができる」という話題が昨年からSNS上で出ていました。それを真っ向から否定することになりかねないという技術にも見えたことから、反発を含めて注目が集まったという印象です。よくよく見ると人間が描いているものとはかなり違い、また、技術の意図そのものも違っているようなのですが。時間の流れを“逆転”させた動画を生成 Paints-Undoを開発したのは、「ControlNet」など画像生成AIツールの研究開発で知られ

colonoe 2024/07/22

あとで読む

リンク

危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ (1/4)

発表後、悪い意味で話題になってしまっていた画像生成AI「Stable Diffusion 3 Medium（SD3M）」に動きがありました。開発元のStability AIは、Weta Digitalの元CEOのプレム・アッカラジュ（Prem Akkaraju）氏がCEOに就任し、新たな資金も調達しました。これで組織として当座の危機は脱したと言えそうです。また、Stable Diffusion 3（SD3）のライセンスについての変更を打ち出してきました。果たして失われた信頼は取り戻せるでしょうか。人気モデル「Pony Diffusion」開発者との対立基本的な情報からすると、やはり、SD3Mはコケたと言っていい状況です。参考情報となりますがGoogleトレンドを見てみると、6月12日のリリース直後は1日で150万ダウンロードされるほど注目を集めていたものの、すぐにシュリンクしてしまって

colonoe 2024/07/15

実際どこで儲かってるのか全然わからない会社だからなあ。投資で資金を調達してもいつまでも続くものではないし

リンク

チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)

Anthropicは6月21日、同社の開発する大規模言語モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」を発表。利用制限はあるものの同社のチャット型AIサービス「Claude.ai」で無料で利用可能になった。同時にユーザーがClaudeとやり取りしながらコンテンツを作成できる新機能「Artifacts」が、さらに25日にはプロジェクトごとに資料やプロンプトを集約できる「Project」が実装された。この記事では、新機能Artifactsを使うときに知っておきたいことをメインに紹介する。なお、Claude 3.5 Sonnetの前の世代である大規模言語モデル「Claude 3」シリーズおよび「Claude.ai」については、こちらの記事に。Claude 3.5 Sonnetについての基本的なスペックなどはこちらの記事に詳しい。 Artifactsのキモは

colonoe 2024/07/06

あとで読む

リンク

AI動画の品質が仕事に使えるレベルになってきた (1/4)

Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています（「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照）。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です（連載第41回「3Dスキャンの進化がすごい」参照）。生成AIの3D化技術で先行していることか

colonoe 2024/07/01

あとで読む

リンク

無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

Invoke、Comfy Org、Civit ai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。企業による技術の独占を防ぎ、アクセシビリティを確保「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivit ai、大規模な学習データセットを構築するLAIONだ。彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン

colonoe 2024/06/27

モデルを作れる人物が所属してないので、現状だとあまり期待してない

リンク

“革命”起こした画像生成AIに暗雲　「Stable Diffusion 3 Medium」の厳しい船出 (1/4)

6月12日、Stability AIの画像生成AI「Stable Diffusion 3 Medium（SD3M）」が公開されました。Stability AIは安定的な収益につながるビジネスモデルの構築に課題を抱えており、最新シリーズ「Stable Diffusion 3（SD3）」をどう位置づけるかが生命線と思われます。そこで、有料APIの使用が必須という形で性能の高い「Stable Diffusion 3 Large（SD3L）」を先行リリースしていました。SD3を「オープン化する」とX上で発言していた創業者のEmad Mostaque氏が4月にCEOを退任したことで約束は守られるのか……とも危惧されてきました。結果としてStability AIは、品質を落としたSD3Mを出すという判断をしてきました。しかし、SD3Mはライティングに高い表現力を持つ一方、意図的に落とされた品質に大きな

colonoe 2024/06/24

現行のSDXLも素のモデルは性能がイマイチだったので、現時点での性能不足はそんなに心配しなくていい。問題はライセンスが不明瞭なことで、改良しようにも手を出せなくなってること

リンク

めちゃ便利になった無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)

OpenAIは5月30日、同社のチャット型AI「ChatGPT」無料版ユーザーに向け、制限付きながら最新の大規模言語モデル「GPT-4o」および、これまで有料版ユーザーしか利用できなかった多くの機能を公開した（発表時のニュース記事）。情報がとても多いので、今回の変更で無料版ユーザーは「なにができるようになったか」、そして「なにができないのか」を使い方中心にまとめた。 1. GPT-4oは回数制限ありチャット型AIアプリの心臓とも言える大規模言語モデル（LLM）、これまで無料版ユーザーは「GPT-3.5」という旧世代モデルしか利用できなかったが、今回の変更で回数制限（具体的な回数は明記されていない）はあるものの、最新モデルのGPT-4oが使えるようになった。 GPT-4oの利用に特に設定などは必要なく、無料アカウントにログインして普通に質問すればOK（使い方はちょっとわかりにくいのでこち

colonoe 2024/06/08

あとで読む

リンク

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる (1/6)

こんにちは、漫画界の生き恥こと野火城と申します。「画像AI使ってみた／AI 漫画実験企画」第2回です！ ■第1回はこちら　実録：AIで描く漫画の実際～体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日本の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。「画像AIの技術がすごいという賞賛記事はよく見るが、それは本当に創作活動で実戦的に使えるものなのか？　『AIに仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは？　実際はどっちなんだ？」「画像AIを試し

colonoe 2024/05/30

あとで読む

リンク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

colonoe 2024/05/27

簡単に神ツールとか言ってると、もっとすごいものがでてきたときに使う言葉が無くなるよ

リンク

いまどきのゲーミングPCでマザー側の映像出力に繋ぐのはあり/なし？古の禁忌に踏み込む (1/6)

「ビデオカードがある時にマザーボード側の映像出力に繋ぐ」のは今でもNGなのか？ PC初心者がデスクトップPCを設置する時にやりがちなミスの1つとして、「ビデオカードがあるのにマザーボード側（オンボード側）にディスプレーを接続する」というものがある。これをやってしまうとディスプレーに映像が出ない、あるいは映像が出たとしてもゲームのレンダリングがCPU内蔵GPUで行われてしまい、ビデオカードは休んだままになってしまう、というものだ。こういったトラブルを防ぐため、ビデオカードを装着したBTOメーカー製PCではオンボード側の映像出力がシールで封印されていることもある。ビデオカードを搭載したBTOメーカー製PCでは、マザーボード側のHDMIやDisplayPort出力に使用不可であることを知らせるシールが貼られていることも多いしかし、このような古の教えはハードやソフトの発展で乗り越えられるよ

colonoe 2024/05/26

あとで読む

リンク

WindowsからWordPadが廃止！ RTF（Rich Text Format）はどうなる？

Windows 95／NT 4.0からあったWordPadがついに廃止 Windowsの標準アプリとして長らく含まれていた「WordPad」が廃止になる。今秋のWindows 11 Ver.24H2から同梱されなくなるようだ。これにより、Windows単体では、RTF形式のファイルを編集できなくなる。といっても多くの人は、RTFファイルなんか使ってないだろう。まあ、Microsoftの考えも理解できないわけではない。ユーザーが少ないプログラムのメンテナンスをいつまでも続けたくないのだ。すでに時計やカレンダーのプログラムがなくなり、電卓はオープンソースになった。Windowsに付属する「アプリケーション」と呼べるプログラムは段々と減っている。もっともWindows 1.0xの頃は、サードパーティアプリケーションがまったくなかったため、必要なものであった。 WordPadの廃止に関しては、

colonoe 2024/05/06

あとで読む

リンク

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。生成AIは「アナログからデジタル」の変化と同じ ──　最初にそれぞれの会社について教えてください。ジェームズ　キム・ドンジュン　2022年下半期ごろから、生成AIに関心をもって、

colonoe 2024/04/29

リンク

AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。そもそもChatGPTの心臓部である大規模言語モデル（LLM）は、膨大な知識を元にテキストを「生成」する仕組みだ。逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚（ハルシネーション）を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

colonoe 2024/04/06

あとで読む

リンク

画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について（素案）」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント（パブコメ）」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について（素案）令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。文化庁文化審議会著作権分科会法制度小委員会（第7回）パブコメへの反応は「素案の内容周知」発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

colonoe 2024/03/11

AIの話題でよく反AIを叩いてるid:Hondara6を最近見かけないと思ったら最後にブクマしたの3月6日だった。飽きた？

リンク

控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

colonoe 2024/02/16

あとで読む

リンク

“生成AIゲーム”急増の兆し　すでに150タイトル以上が登録 (1/4)

1月10日、PC ゲーム配信プラットフォーム「Steam」運営元の米Valveが、生成AI 技術を使ったゲームを認める形で方針を変更しました。今回の変更では「AI 技術を使用するゲームの大半がリリース可能」になるとしており、これまで事実上の禁止と受け止められていた状況からすると大きな方針転換です。ゲーム業界では生成AIの導入が進みつつありますが、生成AIに反対するユーザー、開発者自身の懸念などをはらみつつ進んでいます。すでにSteamでは159ものタイトルが登録済みと急激に増加しつつあります。 Steamのレギュレーションでは、AI生成を「事前生成」と「ライブ生成」の2つに分けています。「事前生成」では、ゲーム開発会社は生成AIに関する開示セクションが追加され、どのように生成AIを利用しているのかをタイトルの販売申請時に記入する必要があります。アート、コード、サウンドなどを使用して作成された

colonoe 2024/01/29

ページを開いて最初に目に入ったのが「龍が如く」だったが、特に記事とは関係なかった

リンク

Stable Diffusionで画像からプロンプト（呪文）を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした (1/3)

本連載「Stable Diffusion入門 from Thailand」は、2024年に入って1回目。今年も「Stable Diffusion」をメインに、画像生成AI周辺の話題について入門者視点でお伝えしていきたい。今回の話題は、Stable Diffusionを手軽に使えるユーザーインターフェースの「Fooocus」。12月13日にリリースされた新バージョン「Fooocus 2.1.831」には、画像をアップロードするとテキストプロンプト（呪文）を生成する「Describe」機能が追加されている。画像をドラッグ＆ドロップしてボタンを押すだけ

colonoe 2024/01/18

既存技術との比較がほしいな

リンク

「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。ノイズ除去をバッチ処理で高速化「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス（CFG）に代わり、残差分類器フリーガイダンス（RCFG

colonoe 2023/12/22

この記事だけでは十分なクオリティなのか判断できない。

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

colonoe 2023/12/11

一部の人達が「絵柄割れ厨」とか言ってるけど全然広まらなかったな

リンク

これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画（Scribble）としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models（LCM）」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」（LoRAはStable Diffusion用の追加学習モデル）が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

colonoe 2023/12/04

あとで読む

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (52)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス