タグ

ブックマーク / ascii.jp (63)

  • 画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)

    Stable Diffusionの共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」が8月1日(現地時間)に発表した最新の画像生成AIモデル「FLUX.1」。画像生成アプリ「ComfyUI」が対応を発表しているので、ローカル環境で動くかどうかを試してみた。 画像生成AIは「Midjourney」「Stable Diffusion」「DALL-E」の三つ巴 現在、画像生成AIの分野は主に「Midjourney」、「Stable Diffusion」、「DALL-E 3」の3つがそれぞれ独自のアプローチでユーザーを集めている。 Midjourneyは直感的なインターフェースと美しい芸術的な出力で知られ、主にクリエイティブな専門家やアーティストに人気がある。 一方、Stable Diffusionはオープンソースの柔軟性と強力なカスタマイズ能力で、技術

    画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)
  • 「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に

    画像生成AIモデル「Stable Diffusion」の共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」は8月1日(現地時間)、高品質な画像生成能力と多様な出力が特徴の最新の画像生成AIモデル「FLUX.1」を発表した。 Stable Diffusionの共同開発者が設立 Black Forest Labs(BFL)は、オープンソースの画像生成AIモデル「Stable Diffusion」の共同開発者として知られるRobin Rombach氏、Patrick Esser氏、Andreas Blattmann氏によって2024年に設立された新興企業。Andreessen Horowitz(a16z)を筆頭とする投資家から3100万ドルの資金を調達したことで注目を集めている。 3つのモデルを展開 We are excited to announce

    「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に
  • 無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

    Invoke、Comfy Org、Civitai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。 企業による技術の独占を防ぎ、アクセシビリティを確保 「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivitai、大規模な学習データセットを構築するLAIONだ。 彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン

    無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない
  • 「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」

    AIスタートアップ「Etched」は6月25日(現地時間)、ChatGPTなど最新のAI技術の基盤となっている「Transformer」アーキテクチャーに特化したチップ「Sohu」を発表した。この発表は、現在NVIDIAが支配的な地位を占めるAIチップ市場に、新たな競争をもたらす可能性がある。 Transformer処理に特化 AIチップ市場は現在NVIDIAが圧倒的なシェアを持つ。同社の汎用GPUは様々なAIモデルを効率的に処理できる柔軟性から市場の約80%を占めている。 多くの大手テクノロジー企業がAI開発のためにNVIDIAのチップに数十億ドルを投資しているのが現状だ。 Etchedの「Sohu」は、ASIC(Application-Specific Integrated Circuit:特定用途向け集積回路)と呼ばれる、特定の用途に最適化された集積回路だ。汎用性は低いものの、特定

    「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」
  • “革命”起こした画像生成AIに暗雲 「Stable Diffusion 3 Medium」の厳しい船出 (1/4)

    6月12日、Stability AI画像生成AI「Stable Diffusion 3 Medium(SD3M)」が公開されました。Stability AIは安定的な収益につながるビジネスモデルの構築に課題を抱えており、最新シリーズ「Stable Diffusion 3(SD3)」をどう位置づけるかが生命線と思われます。そこで、有料APIの使用が必須という形で性能の高い「Stable Diffusion 3 Large(SD3L)」を先行リリースしていました。SD3を「オープン化する」とX上で発言していた創業者のEmad Mostaque氏が4月にCEOを退任したことで約束は守られるのか……とも危惧されてきました。結果としてStability AIは、品質を落としたSD3Mを出すという判断をしてきました。しかし、SD3Mはライティングに高い表現力を持つ一方、意図的に落とされた品質に大きな

    “革命”起こした画像生成AIに暗雲 「Stable Diffusion 3 Medium」の厳しい船出 (1/4)
  • Anthropic、無料で使える「GPT-4o」超えのAIモデル「Claude 3.5 Sonnet」

    Anthropicは6月21日、同社の開発する大規模言語モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」を発表。旧来の上位モデル「Claude 3 Opus」やOpenAIの「GPT-4o」を上回る性能でありながら、中位モデルである「Claude 3 Sonnet」と同等のスピードとコストを実現するという。 「Claude.ai」で無料で使える 「Claude 3.5 Sonnet」は同社が提供するAIチャットサービス「Claude.ai」およびiOS版「Claude」アプリで無料(利用制限あり)で利用できる。有料プランのユーザーは無料ユーザーと比べて利用制限が大幅に緩和される。 また、「Anthropic API」「Amazon Bedrock」「Google CloudのVertex AI」などの環境でも利用可能。価格は、入力トークン100万件あたり3

    Anthropic、無料で使える「GPT-4o」超えのAIモデル「Claude 3.5 Sonnet」
  • ついにベンチマーク解禁の「Snapdragon X」搭載「Copilot+ PC」=「ASUS Vivobook S 15」実機レビュー

    日6月18日、Qualcommの次世代AI機能を搭載するプロセッサー「Snapdragon X」を搭載する「Copilot +PC」が各社から発売された。今回レビューする「ASUS Vivobook S 15 S5507QA」もそのひとつ。ASUSから日市場で初めて発売される「Copilot+ PC」となる。 Vivobook S 15は、NPU単体の処理能力が45TOPSで、CPU、iGPU、NPUを合わせた処理能力が75TOPsを実現したプロセッサー「Snapdragon X Elite」を搭載。専用のWindows Copilotキーを搭載することで、AIアシスタント機能「Windows Copilot」を素早く呼び出せるほか、ASUS AIアプリケーションも用意される。 今回ASUSより試用機を借用したので実機レビューをお届けする。ただし、記事執筆時点において最新のアップデート

    ついにベンチマーク解禁の「Snapdragon X」搭載「Copilot+ PC」=「ASUS Vivobook S 15」実機レビュー
  • 画像生成AI「Midjourney」の使い方 思いどおりの絵を出すための「パラメーター」まとめ【最新版】 (1/4)

    前回は画像生成AIサービス「Midjourney」のアカウント取得から画像生成までの一連の流れを解説した。 大元の仕組みは共通するものの、これまで説明してきた「Stable Diffusion」との違いに戸惑った人もいるのではないか。 とはいえ、どんなパソコンでも(頑張ればスマートフォンでも)画像が生成できるのはやはり魅力。今回はMidjourneyの表現を豊かにする「パラメーター」について説明していく。 パラメーターとは Midjourneyは「Discord」上で「/imagine」コマンドに続き、プロンプト(prompt)欄にテキストプロンプト(Text Prompt)を入力することで画像を生成する。

    画像生成AI「Midjourney」の使い方 思いどおりの絵を出すための「パラメーター」まとめ【最新版】 (1/4)
  • Raspberry Pi 5にNVMe M.2 SSDを接続できるアダプターボードが1480円!

    Raspberry Pi 5にM.2 SSDを接続できるアダプターボード「PCIe TO M.2 Board (C)」が千石電商 秋葉原店で販売中。WaveShareの製品で、価格は1480円だ。 Raspberry Pi 5に高速ストレージのNVMe M.2 SSDを接続するためのアダプターボード。ラズパイ系アクセを多く手がけているWaveShareの製品だ NVMe M.2 SSDをRaspberry Pi 5に接続するためのアダプターボード。サイドマウント方式のボードで、Raspberry Pi 5の16pinケーブルを介して接続する。 接続インターフェースはPCI Express 3.0/2.0に対応し、SSDからのブートも可能。対応フォームファクタはM.2 2230/2242/2260/2280と、幅広いサイズをサポートしている。

    Raspberry Pi 5にNVMe M.2 SSDを接続できるアダプターボードが1480円!
  • ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)

    5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

    ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)
  • eSIMの不正再発行が問題視される中、主要4キャリアの状況を調べた (1/2)

    携帯電話のSMSを使った認証を、なりすましで不正に突破される例が問題視されている。手口としてはスマートフォンやケータイを物理的に盗んだり、他人がなりすまして不正にMNPする例が従来は見られたが、最近ではeSIMの再発行という手法も出てきた。そこで主要4キャリアについてeSIMの再発行が簡単かどうか、あらためてeSIMは不安視すべきものかどうか調べた。 そもそも不正なeSIM再発行をされると何が起こるのか? eSIM再発行とは、端末間で物理的なSIMカードを差し替えることに相当する行為だ。特にeSIMでは、物理SIMでは必要だった発送や受け取りが不要。たとえばネットで新規加入の手続きをすれば、SIMの到着を待つことなく、すぐに使うことができる。 手軽でスピーディーな反面、誰かが不正にeSIM再発行の手続きをして、別の端末でeSIMを受信してアクティベーションしてしまえば、どこかの誰かのスマー

    eSIMの不正再発行が問題視される中、主要4キャリアの状況を調べた (1/2)
  • ソフトバンク、1兆パラメーターのLLM開発へ。経産省が421億円助成

    ソフトバンクは5月10日、経済安全保障推進法に基づく「特定重要物資クラウドプログラムの供給確保計画」について、経済産業省から認定を受けたことを発表。同社はこの計画に基づき、2024年度から25年度にかけておよそ1500億円を投じ、国内複数拠点にAI計算基盤を新設する。今回、計画が経産省に認定され、最大421億円の助成金を受ける予定だ。 ソフトバンクは2023年9月に、53億円の助成を受けて生成AI開発向けの大規模なAI計算基盤を構築し、稼働を開始。AI計算基盤の構築に対しては、2023年7月に経済産業省「クラウドプログラム」の供給確保計画に認定され、53億円の助成を受けている。 現在、子会社SB Intuition(エスビーインテュイッションズ)が日語に特化した国産の大規模言語モデル(LLM)の開発に利用しているほか、日国内の企業や研究機関に対してサービスを提供している。 今回の大規

    ソフトバンク、1兆パラメーターのLLM開発へ。経産省が421億円助成
  • 小さくても高性能 日本語AIモデル「Japanese Stable LM 2 1.6B」

    Stability AIは5月9日、日語大規模言語モデル「Japanese Stable LM 2 1.6B(JSLM2 1.6B)」をリリースした。モデルサイズを16億パラメータと軽量化することで必要なハードウェアを小規模に抑えることが可能だという。 スピードと性能を両立した軽量モデル 🎉日語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました🎉 Japanese Stable LM 2 1.6B(JSLM2 1.6B)は16億パラメータで学習した日語の小型言語モデルです。 こちらのモデルはStability AI メンバーシップにご加入いただくことで商用利用が可能です。 詳細はこちら💁‍♀️… pic.twitter.com/b35t2Il4lm — Stability AI Japan (@StabilityAI_JP) May 9,

    小さくても高性能 日本語AIモデル「Japanese Stable LM 2 1.6B」
  • マイクロソフト最新SLM「Phi-3」 メタ「Llama 3」あっさり抜く

    マイクロソフトは4月23日、生成AI向けの小規模言語モデル(SLM)「Phi-3-mini」を発表した。 Phi-3-miniは、パラメーター数が38億の比較的小型軽量な言語モデル。単純なタスクに適しており、特定のニーズに合わせて容易に微調整できる点を特徴とする。スマートフォンや自動車のコンピューター、リモートカメラといったリソースの少ないデバイスでも利用できるほか、オフライン動作にも対応し、ネット接続が困難な地域でも生成AIの恩恵を受けられるという。 同社が実施したベンチマークテストでは、パラメーター数で勝るメタの「Llama 3-8B-in」(80億)や、グーグルの「Gemma 7B」(70億)に対して、より優れた性能を発揮。特にLlama 3に関しては、4月18日のリリースからわずか5日でPhi-3-miniに追い越される形となった。 ただしPhi-3-miniも万能ではなく、広範な

    マイクロソフト最新SLM「Phi-3」 メタ「Llama 3」あっさり抜く
  • GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

    カナダのAIスタートアップCohereは4月4日(現地時間)、ビジネス向けに最適化された最新の大規模言語モデル(LLM)「Command R+」を発表した。 高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransformerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K(12万

    GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」
  • Stability.ai、1枚の画像から破綻のない3Dオブジェクトを生成できる「Stable Video 3D」公開

    Stability.ai、1枚の画像から破綻のない3Dオブジェクトを生成できる「Stable Video 3D」公開 Stability.aiは3月19日、一枚の画像から高品質な3Dモデルを生成できるAIモデル「Stable Video 3D(SV3D)」を公開した。商用利用の場合のみ月額20米ドル(およそ3000円)のStability AIメンバーシップへの加入が必要となる。 動画生成AI「Stable Video Diffusion」をベースに開発 Stable Video Diffusion に基づく新しい生成モデル、Stable Video 3D をリリースしました。このモデルは、3D技術の分野を進歩させ、品質とマルチビューを大幅に向上させます。 詳細はこちらをご確認ください。https://t.co/1WhHaSv6A5pic.twitter.com/VwraKaOFCd —

    Stability.ai、1枚の画像から破綻のない3Dオブジェクトを生成できる「Stable Video 3D」公開
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
  • 画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)

    プロンプト:1 girl, photorealistic, solo, perfect lighting, sailor dress, looking at viewer, long hair, black hair, two side up, ネガティブプロンプト:illustration, 3d render, (worst quality:2), (low quality:2), (normal quality:2), signature, watermark, username, open mouth

    画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)
  • テキストが崩れない! 画像生成AIの最新版「Stable Diffusion 3」登場

    Stability.aiは2月22日(現地時間)、同社が開発する画像生成AI「Stable Diffusion」シリーズの最新版となる「Stable Diffusion 3」の初期プレビューを発表、ウェイティングリストを公開した。 正確にアルファベットを出せる Stable Diffusion 3は旧モデルと比較して、画質および様々なプロンプトへの対応が大幅に向上した最新のText 2 Imageモデルだ。 特にこれまでのモデルでは難しかった「画像内での正確なアルファベット表記」が可能になっている。 プロンプト:Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of c

    テキストが崩れない! 画像生成AIの最新版「Stable Diffusion 3」登場
  • 画像生成AI「Stable Diffusion」使い倒すならコレ! 「ComfyUI」基本の使い方 (1/3)

    前回はStable Diffusionをブラウザーで利用するためのUIとして「Stable Diffusion web UI(AUTOMATIC1111版)」、「Fooocus」と共に多く使われている「ComfyUI」のインストール方法を紹介した。とりあえず画像の生成はできたので、あらためてインターフェースを詳しく見ていこう。 まずは前回の手順に従いインストールした「ComfyUI」を起動。この画面が出ていなければ「Load Default」をクリックしよう。 いくつかの四角いパーツが、カラフルなケーブルのようなもので接続されているのが見える。 ComfyUIでは配置されたそれぞれのパーツを「ノード」と呼ぶ。それぞれのノードは「モデルをロードする」「プロンプトを書く」といった機能を持っている。これらをブロックのように組み合わせて利用したい機能を構築していくのが「ノードベース」と呼ばれるCo

    画像生成AI「Stable Diffusion」使い倒すならコレ! 「ComfyUI」基本の使い方 (1/3)