ブックマーク / ascii.jp (40)

  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
  • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

    OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

    新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
  • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

    筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

    まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
  • これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)

    これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 複数のUI環境のインストールや更新がワンクリックで可能に 画像生成AI「Stable Diffusion」をブラウザーで使うために必要なのがUI環境。筆者が入門したときは「Stable Diffusion WebUI(AUTOMATIC1111版)」しか選択肢がなかったが、現在は「ComfyUI」「Fooocus」「Stable Diffusion WebUI Forge」など様々な種類が出ている。 これらは基的に別のアプリケーションなので、それぞれ環境設定・インストールをする必要があり、パソコンの中に複数の環境が乱立しがちだ。 さらに、これらのUIで利用するモデル(Checkpoint)やVAE(高画質化ツール)、LoRA(追加学習モデル)などもUIごとに必要になる。シンボリックリ

    これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
  • ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

    Anthropicは10月16日(現地時間)、同社が公開するAIチャットボット「Claude 2」の公開範囲を日を含む世界95の国と地域に拡大したことを明らかにした。 リストにEU加盟国なし We’re rolling out access to https://t.co/RxKnLNNcNR to more people around the world. Starting today, users in 95 countries can talk to Claude and get help with their professional or day-to-day tasks. You can find the list of supported countries here: https://t.co/PbMuaqJcjU — Anthropic (@AnthropicAI) O

    ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
  • 画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します (1/3)

    前回の記事では、StabilityAIの最新画像生成モデルStable Diffusion XL(SDXL)を簡単に使えるWebインターフェース「Fooocus」を紹介した。 画像生成AIの制御技術「ControlNet」でも知られる作者lllyasviel(Lvmin Zhang)氏の開発ペースはとても早い。前回の記事掲載後にも多くの便利な新機能が実装されたため、今回はこれらを紹介する。 「Fooocus」のインストール方法は前回記事を参照。一度インストールすればアップデートは起動時に自動でかかるため、利用者が意識することはない。 アップデートの内容についてはGitHub内のDiscussionsページを参照しよう。

    画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します (1/3)
  • 商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)

    AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AIEmi(Ethereal master of illustration)」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。 「Stable Diffusion XL(SDXL)」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。 なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。 モデルをダウンロードして指定フォルダーに入れるだけ まずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待と

    商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)
    se7en1
    se7en1 2023/09/30
  • アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

    原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基原理です。生成できる時間は、16コマ/2秒

    アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)
  • Windowsにおけるファイルリンクについてあらためて説明する (1/2)

    Windowsを始め、多くのOSにはファイルの「リンク」機能がある Windowsに限らず、多くのOSが持つファイルシステムには「リンク」と呼ばれる機能がある。ファイルは、パスにより一意に特定可能だが、人間がファイルを管理するとき、どうしても同じファイルを別の場所(パス)にも配置したくなることがある。これを実現するのがリンクだ。リンクには、大きく「ハードリンク」と「ソフトリンク」(あるいはシンボリックリンクともいう)の2種類がある。 ファイルシステムには、ファイル名を管理するディレクトリ領域とファイルの中身を記録する領域がある。ハードリンクはこの仕組みを利用して、同じファイルの中を指し示すファイル名を異なるパスに作る。 特徴として、後から作ったハードリンクもオリジナルのファイル名も区別がなく、どちらも同じファイルとして扱える。通常は、ファイルシステム側に「参照カウント」と呼ばれる情報があり

    Windowsにおけるファイルリンクについてあらためて説明する (1/2)
  • ChatGPT新機能が“無双”だった(西田宗千佳) (1/4)

    新連載を始める。テーマはAIのニュースチェックだ。基的には2週に一度、主にASCII.jpで公開されるニュースについて、簡単な解説と流れの分析をしていきたい。紹介されていないものでも重要な話については、別途短い解説を追記していく。 というわけで1回目は、2023年7月前半のAIニュース振り返りだ。 (※記事のタイトルをタップすると記事ページが開きます) DeepL、日法人「DeepL Japan 合同会社」を設立 日企業との取引を迅速化(7月3日) 翻訳AIは急速に品質が上がり、日常的に筆者もお世話になっている。DeepLは利用者を増やしているが、実のところ、無料版が強いというよりも「個人事業主でも、企業でも気軽に契約できる有料版」があることがビジネスの強みだ。日の場合、翻訳AIを使うといってもそれは「無料でGoogle翻訳を使う」ことが多く、有料版利用は企業でも多くはないという。

    ChatGPT新機能が“無双”だった(西田宗千佳) (1/4)
  • 世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)

    Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。 大きな違いは「2回生成する」こと SDXLがこれまで

    世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)
  • ChatGPTの新機能コードインタープリターに《未来の仕事の全自動化》が見える

    国勢調査(csv)と国土地理院(xls)とドン・キホーテ店舗数(html)を自動マージしてパワポにする OpenAIが、ChatGPTに革命的ともいえる新機能「Code Interpreter」を追加して、試した人たちの間で大騒ぎになっている。さまざまな機能が可能になっているが、その質は名前のとおりChatGPTの中でプログラムを実行可能になったことだ。 ChatGPT plus(20ドル/月の有料ユーザー)は、随時このCode Interpreter というプラグインが使えるようになるそうなのだが。画面左下から「Settings」を選び、「Code Interpreter」のスライドスイッチをONできれば利用可能。「New Chat」をスタートしたときに「GPT-4」を選び、「Code Interpreter」にチェックする。 とくに、データサイエンティスト的な数値の分析の世界にインパ

    ChatGPTの新機能コードインタープリターに《未来の仕事の全自動化》が見える
  • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

    画像生成AIStableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

    画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
  • Blenderに挫折する前に見てほしい、日本語の解説動画を紹介

    みなさんBlenderやってますか?? 私は大好きです。 どうも花田です。前にもBlenderについて書きましたが、今回は挫折した、若しくはBlender分からんッッ! って人に話します。 Blender語で解説してくれている人いるよ~ います。 中でも、当に当に初期にお世話になった人たちを2人紹介します。 M design - YouTube 話してくれる声は少なめで、動画を止めてゆっくり進めていく方式です。 情報量が少なく、作っている動画なので見よう見まねでできました。 3D Bibi - YouTube 簡単なモデルを細かく教えてくれるため、モデルが挫折しない。 YouTubeでBlenderで検索すると他の動画も沢山出てきます。 作りたいものを作りたいんだ! 作りたいものを検索しても、日語版が出てこない… 英語版を見て、挫折してしまった人も多いのではないでしょうか。 Bl

    Blenderに挫折する前に見てほしい、日本語の解説動画を紹介
  • ChatGPTより速いと話題「Easy-Peasy.AI」テンプレート機能がすごい充実! 使い方ガイド (1/3)

    「Easy-Peasy.AI」は、OpenAIの会話形AIChatGPT」よりも“10倍早い”をうたい文句にしたサービスだ。トップページの説明文に「AI Content Generator」とあるように、チャットだけではなく、AIを使って様々な文書を生成するツールを集めたポータルサイトのようなサービスとなっている。 簡単な作業なのになかなか手がつけられないことも多い定型文書作成のストレスを、AIでなくしていく方向に全振りしたEasy-Peasy.AIの使い方を解説していこう。 「Chat(チャット)」の使い方

    ChatGPTより速いと話題「Easy-Peasy.AI」テンプレート機能がすごい充実! 使い方ガイド (1/3)
  • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

    こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

    Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
    se7en1
    se7en1 2021/05/23
  • Flexboxよりも新しい!CSSレイアウトの最新仕様Grid Layout を先取りしよう

    CSSのレイアウトといえば、伝統的にはfloatプロパティ、最近ではFlexboxを使うのが常識。でも、仕様策定中の「Grid Layout Module」を使うと、もっと効率よくレイアウトができるようになりそうですよ。 複雑なWebサイトを作成する場合、グリッドは重要な役割を果たします。グリッドを利用することでWeb作成のスピードアップができるフレームワークが多いことからも、現代のWebデザインでグリッドが重要であることは明らかです。 標準化が進められている「CSS Grid Layout Module」の仕様を導入することで、グリッドシステムを利用するために別のスタイルシートを用意する必要がなくなります。もう1つメリットを挙げるとすれば、Webページで要素を配置するのにinlineやfloatのようなプロパティに頼る必要もありません。この記事では、グリッドレイアウトの基を紹介し、簡単

    Flexboxよりも新しい!CSSレイアウトの最新仕様Grid Layout を先取りしよう
    se7en1
    se7en1 2021/03/12
  • 老兵のようなRDBMSからの解放を AWSが手がけるデータストアの再発明

    オンラインで開催されているAWS最大のグローバルカンファレンス「AWS re:Invent 2020」。12月2日に行なわれたAWS CEOのアンディ・ジャシー氏の基調講演では、データストア分野にもフォーカス。ストレージとデータベースの新サービスは、コスト削減と高い性能を求める顧客の声に応えた正常進化と言えそうだ。 もはや古いデータストアでは対応できない 3時間におよぶアンディ・ジャシー氏の基調講演において、コンピュート分野に続いて解説されたのがデータストアの分野だ。ここではデータを利活用するストレージの技術革新に加え、データベースへの取り組みも披露された。 まずゲストとして登壇したのは、2006年のAmazon S3ラウンチ当時にいち早くデータを格納したSmugMugの創業者であるドン・マクスキル氏。S3にデータをホストしたことで、最新の分析やデータ管理ツールを利用でき、1日数十億枚とい

    老兵のようなRDBMSからの解放を AWSが手がけるデータストアの再発明
    se7en1
    se7en1 2020/12/06