並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 962件

新着順 人気順

"Stability AI"の検索結果241 - 280 件 / 962件

  • Stability AI、単一画像から3Dモデルを生成できる「TripoSR」をオープンソースで公開/Tripo AIとコラボレーションし、1秒で高品質な3Dオブジェクトを生成

      Stability AI、単一画像から3Dモデルを生成できる「TripoSR」をオープンソースで公開/Tripo AIとコラボレーションし、1秒で高品質な3Dオブジェクトを生成
    • 画像生成AI「Stable Diffusion 3 Medium」公開 プロンプトの理解力が上がり、リアルな画像が生成可能に

      画像生成AI「Stable Diffusion 3 Medium」公開 プロンプトの理解力が上がり、リアルな画像が生成可能に Stability.aiは6月12日、同社が開発する画像生成AI「Stable Diffusion 3」シリーズの最新モデル「Stable Diffusion 3 Medium」を発表、重み付きモデルをHugging Faceで公開した。無償の非商用ライセンスおよびクリエイターライセンスの下で利用可能だ。 3種類のテキストエンコーダーで複雑なプロンプトに追従 Stable Diffusion 3 シリーズの最新かつ最も洗練されたモデルである Stable Diffusion 3 Medium をご紹介します。 このリリースは、生成 AI の進化における大きなマイルストーンであり、オープンな生成AIに対する私たちの取り組みを継続するものです。 詳細は、こちらをご覧くだ

        画像生成AI「Stable Diffusion 3 Medium」公開 プロンプトの理解力が上がり、リアルな画像が生成可能に
      • Stability AIが画像を認識して日本語で回答してくれるAIモデル「Japanese InstructBLIP Alpha」をリリース

        画像生成AI「Stable Diffusion」を開発するStability AIが、日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開したと発表しました。入力した画像に対して日本語で説明を生成できる画像キャプション機能や、画像についての質問を日本語で入力すると日本語で回答する機能が搭載されています。 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan https://ja.stability.ai/blog/japanese-instructblip-alpha stabilityai/japanese-instructblip-alpha · Hugging Face https://huggingface.co/stabilityai/japanese-i

          Stability AIが画像を認識して日本語で回答してくれるAIモデル「Japanese InstructBLIP Alpha」をリリース
        • Sakana AIのCOO激白、優秀な人材獲得し「24年に日本でチャンピオン企業になる」

          国内外から大きな注目を集める人工知能(AI)のスタートアップがある。2023年に設立されたSakana AI(サカナAI)だ。大規模言語モデル(LLM)などに関連した技術開発に力を注ぐ。設立から1年未満にもかかわらず、すでに米Google(グーグル)や米NVIDIA(エヌビディア)などもアプローチをかける。出資の大部分を海外の企業から受けているが、2024年1月にはNTTグループやKDDI、ソニーグループなどから総額およそ45億円を調達した。 Sakana AIの共同創業者には元グーグルの研究者だったDavid Ha(デイビッド・ハ)CEO(最高経営責任者)、生成AIの発展を支える「Transformer」に関する論文の共同執筆者であったLlion Jones(ライオン・ジョーンズ)CTO(最高技術責任者)、外務省からメルカリに転じて執行役員を務めた伊藤錬COO(最高執行責任者)が名を連ね

            Sakana AIのCOO激白、優秀な人材獲得し「24年に日本でチャンピオン企業になる」
          • クラウドで動く生成AIアプリ、MicrosoftとGoogleが合計6種類もの開発ツール

            大手プラットフォーマーが2024年5月から6月にかけて発表した生成AI(人工知能)に関する施策を比較しながら紹介する本特集。第3回は米Microsoft(マイクロソフト)と米Google(グーグル)が発表した、クラウドで稼働する生成AIに関する取り組みを紹介しよう。 本特集の第1回、第2回で取り上げたように、大手プラットフォーマーは生成AIの新しい選択肢として「オンデバイス」に力を入れ始めている。クラウドで推論を行うクラウドLLM(大規模言語モデル)ではなく、スマートフォンやパソコンなどのデバイス上で稼働するオンデバイスSLM(小規模言語モデル)を使う。 もっともオンデバイスSLMは、クラウドLLMを単純に置き換える存在にはならない。オンデバイスSLMはプロンプトを入力してから結果が表示されるまでのレイテンシー(遅延)が低い一方、モデルのパラメーター数が少ないため、性能ではクラウドLLMに

              クラウドで動く生成AIアプリ、MicrosoftとGoogleが合計6種類もの開発ツール
            • rinna、Llama 2の日本語継続事前学習モデル「Youri 7B」を公開|rinna株式会社

              Llama 2の性能を日本語に引き継いだモデルシリーズによりLLMの活用が容易に rinna株式会社(本社:東京都渋谷区/代表取締役:ジャン"クリフ"チェン、以下rinna)は、Llama 2に日本語の学習データで継続事前学習を行った「Youri 7B」シリーズを開発し、LLAMA 2 Community Licenseで公開したことを発表します。 ■ rinnaのモデル公開活動 OpenAI社が開発した大規模言語モデル (Large Language Model; LLM) であるChatGPTのサービスは、世界中の多くのユーザーが利用するサービスへと発展しました。ChatGPTに匹敵するLLMを開発するために世界中の研究・開発者が切磋琢磨し、その成果を共有・公開しています。rinnaも、研究成果を積極的に発表・公開しており、これまでに日本語に特化したGPT・BERT・HuBERT・CL

                rinna、Llama 2の日本語継続事前学習モデル「Youri 7B」を公開|rinna株式会社
              • Stability AI、最小限のデータで学習させた大規模言語モデル(LLM)「FreeWilly」を公開 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                Image credit: Stability AI 新しい大規模言語モデル(LLM)が登場した。「FreeWilly1」と「FreeWilly2」だ。 画像ジェネレーティブ AI「Stable Diffusion」を開発したStability AI が21日に発表した、この2つの新しい LLM は、いずれも Meta のオープンソースモデル「LLaMA」と「LLaMA 2」をベースにしているが、合成データ(アルゴリズムによって生成された、限りなく実際のデータに近い人工データ)を含むまったく新しい小規模なデータセットで訓練されている。 どちらのモデルも、複雑な推論や言語的な機微、法律や数学のような専門的な領域に関する複雑な質問に答えることに長けている。 Stability の子会社である CarperAI は、FreeWilly sを「非商用ライセンス」の下でリリースした。つまり、ビジネス

                  Stability AI、最小限のデータで学習させた大規模言語モデル(LLM)「FreeWilly」を公開 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                • 色々なAI(LLM)に片っ端から「からあげにレモンをかけたら死刑ですか?」と聞いてみた - karaage. [からあげ]

                  LLMに聞いてみた ちまたで話題の大規模言語モデル(LLM、ChatGPTみたいなやつね)に、片っ端から聞いてみました。 特に意味もないですし、条件も回数も適当ですので、意味のある比較ではなくて、たんなる結果の羅列です。3Bとか7Bというのは、モデルのパラメータの数でBはビリオン(10億)を意味します。これが大きいほど賢い傾向があります(必ずしもそうでもないですが)。 ChatGPT GPT-4 user:からあげにレモンをかけたら死刑ですか? ChatGPT: いいえ、「からあげにレモンをかけたら死刑ですか?」という質問はおそらくジョークや冗談としての意味合いで使われることが多いでしょう。実際に、からあげにレモンをかける行為で死刑を受けることはありません。からあげにレモンをかけるのは、多くの人々にとって普通の食べ方の一つです。 文化や地域、個人の好みによって、食べ物の食べ方や組み合わせに

                    色々なAI(LLM)に片っ端から「からあげにレモンをかけたら死刑ですか?」と聞いてみた - karaage. [からあげ]
                  • 2023年9月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料 | DevelopersIO

                    こんにちは、臼田です。 みなさん、AWSの最新情報はキャッチアップできていますか?(挨拶 社内で行っているAWSトレンドチェック勉強会の資料をブログにしました。 AWSトレンドチェック勉強会とは、「日々たくさん出るAWSの最新情報とかをブログでキャッチアップして、みんなでトレンディになろう」をテーマに実施している社内勉強会です。 このブログサイトであるDevelopersIOには日々ありとあらゆるブログが投稿されますが、その中でもAWSのアップデートを中心に私の独断と偏見で面白いと思ったもの(あと自分のブログの宣伝)をピックアップして、だいたい月1で簡単に紹介しています。 9月はなんと69本もピックアップしています。注目はついにリリースされたAmazon Bedrockですね!すでに色々記事があります! ちなみにAWSの最新情報をキャッチアップするだけなら週刊AWSがおすすめですが、Dev

                      2023年9月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料 | DevelopersIO
                    • Google Colab で Stable Cascade を試す|npaka

                      「Google Colab」で「Stable Cascade」を試したので、まとめました。 【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Stable Cascade「Stable Cascade」は、「Würstchen」ーキテクチャをベースにした新しいテキスト画像変換モデルです。3段階のアプローチにより、一般消費者向けハードウェアでの学習とファインチューニングが簡単にできます。非商用利用のみを許可する非商用ライセンスの下でリリースされます。 ファインチューニング、ControlNet、LoRA学習用のスクリプトを Stability AI の GitHub で公開しています。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「A1

                        Google Colab で Stable Cascade を試す|npaka
                      • OpenAIなどのクローズドなAI開発のリスク、学者らが警鐘

                        人工知能(AI)分野における2023年の出来事のうち、将来重大な影響を及ぼす可能性のあるものの1つは、「ChatGPT」を開発したOpenAIが3月に最新の大規模言語モデル(LLM)「GPT-4」を発表した際、このプログラムに関する詳細な技術情報を非公開にするという決定を下したことだ。 同社が突如として秘密主義に転換したことが、テクノロジー業界にとって大きな倫理的問題になりつつある。というのも、OpenAIとそのパートナーであるMicrosoft以外の誰も、両社のコンピューティングクラウド内のブラックボックスで何が起こっているのかを知り得ないからだ。 オックスフォード大学のEmanuele La Malfa氏とアラン・チューリング研究所およびリーズ大学の共同研究者らは9月、こうした問題をテーマとした論文をarXiv.org(査読なしのオープンアクセスジャーナル)に発表した。 この論文で、L

                          OpenAIなどのクローズドなAI開発のリスク、学者らが警鐘
                        • Stability AI、「Stable Audio Open」を公開 ~最大47秒のオーディオ素材をテキストから生成/オープンソースなので自分の演奏をもとに微調整も可能

                            Stability AI、「Stable Audio Open」を公開 ~最大47秒のオーディオ素材をテキストから生成/オープンソースなので自分の演奏をもとに微調整も可能
                          • 「Nejumi LLM リーダーボード」で評価された大規模言語モデル数が日本最大級に

                            「Nejumi LLM リーダーボード」で評価された大規模言語モデル数が日本最大級にJGLUEデータを使ったLLM日本語評価を自動化し再現可能なジョブを公開 Weights & Biases Japan株式会社(以下、W&B Japan)は、2023年7月より大規模言語モデル(LLM)の日本語性能を評価結果のランキングを公開する「Nejumi LLM リーダーボード」(以下、Nejumiリーダーボード)を運用して来ましたが、このたび評価されたLLMモデルの数が20を超え、日本語性能評価のLLMモデルリーダーボードとしては日本最大級の規模になりました。本ランキングはオンライン上で公開されており、http://wandb.me/nejumi からアクセスすることができます。評価に使われているコードは実行可能なWandBジョブ形式で公開されており、モデルが公開された際には今後も順次評価結果が追加

                              「Nejumi LLM リーダーボード」で評価された大規模言語モデル数が日本最大級に
                            • 大規模言語モデル(LLM)における日本語評価の概観 - Algomatic Tech Blog

                              はじめまして!Algomatic LLM STUDIO でインターンをしている なべ(@_h0jicha)です。普段は大学でマルチモーダル大規模言語モデルの応用に関する研究に取り組んでいます。 Algomatic のインターンでは、LLM の評価に関して網羅的な調査や各種ツールの導入に取り組んできました。 本記事では、この知見を皆さんに共有することで、日本語圏における LLM 評価の現状を俯瞰していただき、各ツールを適切に選択するための糸口を提供することを目的とします。 はじめに 大規模言語モデル(LLM)の開発プレイヤーが増加している昨今において、日本語を対象言語とした運用を得意とする LLM が次々と公開されています。 LLM を安全に使用する ために、対象タスクに適した LLM を選択すること、ならびに有害なコンテンツ生成を検知することなど、LLM の性能を多角的に評価する枠組みが重

                                大規模言語モデル(LLM)における日本語評価の概観 - Algomatic Tech Blog
                              • Stability AIがコーディング用のAI「StableCode」をリリース 業務支援や学習ツールとして利用可能

                                Stability AIは、2023年8月8日(米国時間)、同社初のコーディング用LLM生成AIである「StableCode」のリリースを発表した。この製品は、プログラマーの日常業務を支援するとともに、次のレベルに向けてスキル向上を目指す新人開発者向けの学習ツールとして開発された。 StableCodeの3モデル StableCodeは、3つの異なるモデルを使用してコーディングを支援する。いずれも開発者の効率性を高めるためのものだ。 ベースモデル(StableCode-Completion-Alpha-3B-4K) ベースモデル(StableCode-Completion-Alpha-3B-4K)は、最初にBigCodeのスタックデータセット(v1.2)から多様なプログラミング言語のデータを使用して訓練された。その後Python、Go、Java、JavaScript、C、markdown、

                                  Stability AIがコーディング用のAI「StableCode」をリリース 業務支援や学習ツールとして利用可能
                                • 日本語LLMでLLaVAの学習を行ってみた - Qiita

                                  はじめに 本記事はLLM Advent Calendar 2023 2日目の記事になります。 最近、様々なLLMが発表されたことによりローカルLLM界隈では自作データセットを作成して自分好みのLLMを作成するなど日本語LLM界隈は盛り上がりを見せています。 一方、マルチモーダルなLLMとして画像を組み合わせたものに関してはTuring、Stability AI、Rinnaなどの企業ではモデルを公開していますが、個人で行われている方は少ないという印象があります。 そこで今回はLLaVAと同じ方法で日本語LLMを学習させて、個人でマルチモーダルなLLMの学習を行ってみました。個人で学習できる範疇ということで学習はRTX4090 1台で行っています。 学習に使用したコードは以下で公開しています。 モデルは以下で公開しています。 事前学習に使用した日本語翻訳データセットは以下で公開しています。 L

                                    日本語LLMでLLaVAの学習を行ってみた - Qiita
                                  • Stable DiffusionのSDXL1.0モデルと拡張機能のあれこれ

                                    この記事は GMOアドマーケティング Advent Calendar 2023 24日目の記事です。 こんにちは、GMOアドマーケティングのM.Hです。今年ももう年の瀬を迎えようとしておりますが、思い返せば自然言語についても画像についても生成AIの進化や多様化の著しい2023年でしたね。来年も同じこと言ってそうですが…笑 この記事ではそんな話題の中から画像生成AIの、実は最近また勢いづいてきているStability AIのStable Diffusionについて、特にStable Diffusionの最新モデルであるSDXL1.0にまつわる内容を取り上げていきます。 注意:本記事で掲載している生成画像およびサムネイル画像は全て商用利用可能であるOpenAIのサービスであるDALL-E3およびStability AIの公式モデルを用いて作成したものです。いずれもコンテンツポリシーやライセンス

                                      Stable DiffusionのSDXL1.0モデルと拡張機能のあれこれ
                                    • 画像生成AI開発で知られるStability AIの共同創業者エマド・モスタク氏がCEOと取締役を辞任、理由は「分散型AI追求のため」

                                      画像生成AI「Stable Diffusion」の開発元として知られるスタートアップ・Stability AIが、共同創業者であるエマド・モスタク氏のCEOおよび取締役の辞任を発表しました。 Stability AI Announcement — Stability AI https://stability.ai/news/stabilityai-announcement Stability AI CEO resigns to ‘pursue decentralized AI’ - The Verge https://www.theverge.com/2024/3/23/24109511/stability-ai-ceo-emad-mostaque-resignation-decentralized-ai Stability AIの声明によれば、モスタク氏の辞任の理由は「分散型AI追求のた

                                        画像生成AI開発で知られるStability AIの共同創業者エマド・モスタク氏がCEOと取締役を辞任、理由は「分散型AI追求のため」
                                      • StableCode をリリースしました — Stability AI Japan — Stability AI Japan

                                        Stability AI は、初のコーディング用 LLM 生成AI製品である StableCode をリリースしました。この製品は、プログラマーの日常業務を支援すると同時に、スキルを次のレベルに引き上げる準備ができている新人開発者向けの優れた学習ツールとしても設計されています。 “a colorful parrot with glasses typing away at a computer, flat icon, vector” – SDXL 0.9 StableCode は、3つの異なるモデルを使用してコーディングを支援することで、開発者がより効率的になるためのユニークな方法を提供します。ベースモデルは、まず BigCode のスタックデータセット(v1.2)から多様なプログラミング言語のセットでトレーニングされ、Python、Go、Java、Javascript、C、markdown

                                          StableCode をリリースしました — Stability AI Japan — Stability AI Japan
                                        • 楽天、日本語に最適化したオープンかつ高性能なLLMを公開 | 楽天グループ株式会社

                                          - 「LM Evaluation Harness」の評価基準において、基盤モデルとインストラクションチューニング済モデルがオープンな日本語LLMにてトップを獲得 - 楽天グループ株式会社(以下「楽天」)は、日本語に最適化した高性能の大規模言語モデル(以下「LLM」)の基盤モデル(注1)「Rakuten AI 7B」(以下「本基盤モデル」)と、同モデルを基にしたインストラクションチューニング済モデル(注2)「Rakuten AI 7B Instruct」(以下「本インストラクションチューニング済モデル」)、インストラクションチューニング済モデルを基にファインチューニングを行ったチャットモデル(注3)「Rakuten AI 7B Chat」をオープンなモデルとして、3月21日(木)に公開しました。 「Rakuten AI 7B」は、フランスのAIスタートアップであるMistral AI社のオー

                                            楽天、日本語に最適化したオープンかつ高性能なLLMを公開 | 楽天グループ株式会社
                                          • 安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表

                                            大手フォトストックサービスのGetty Imagesが、安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images(powered by NVIDIA)」を発表しました。Getty Imagesの画像生成AIは、Getty Imagesが所有するクリエイティブ素材とデータのみでトレーニングされているため、画像生成AIの課題となっている権利的な問題をクリアしているとのことです。 生成AI by Getty Images(powered by NVIDIA) | Getty Images 日本 https://www.gettyimages.co.jp/ai/%E7%94%9F%E6%88%90/%E8%A9%B3%E7%B4%B0 Getty made an AI generator that only trained on its licensed images -

                                              安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表
                                            • 生成AIの回答を「指示の出し方」で洗練させるプロンプトエンジニアリングとは

                                              関連キーワード 人工知能 テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)を効果的に使うには、適切なプロンプト(情報生成のための質問や指示)を作成する必要がある。目的に沿った回答を得るためには、プロンプトの作成の仕方や扱い方、生成AIの土台となっているML(機械学習)モデルのアルゴリズムや学習データの制約などを理解しなければならない。 生成AIの基礎となる大規模言語モデル(LLM)などのAIモデルを使用する際、望ましい出力を生成させるためのプロンプトを作成する設計プロセスを、「プロンプトエンジニアリング」と呼ぶ。その目的は、特定の結果を得るためにAIモデルを使うエンドユーザーを支援することだ。プロンプトエンジニアリングには論理的思考力、コーディングスキル、芸術的センスといった要素が必要なことがある。質問を別の表現に言い換えるだけで、AIモデルが全く異

                                                生成AIの回答を「指示の出し方」で洗練させるプロンプトエンジニアリングとは
                                              • GPT、Geminiだけじゃない 押さえておきたい「主要LLM」8選はこれだ

                                                関連キーワード 人工知能 | Google | チャットbot | Facebook | Microsoft(マイクロソフト) 人工知能(AI)技術の進化に伴い、大規模言語モデル(LLM)は多様化の時代を迎えている。LLMは自然言語処理において飛躍的な性能向上を遂げるだけでなく、オープンソース化や軽量化をはじめとする多様な進化を見せている。 注目に値するLLMはOpenAIの「GPT」や、Googleの「Gemini」だけではない。どのようなLLMが登場しているのか。前編に続き、主要LLM19種のうち12~19個目を紹介する。 GPTやGeminiだけじゃない 押さえておきたい「主要LLM」8選 併せて読みたいお薦め記事 連載:代表的なLLM19選を徹底解説 前編:BERT、GeminiからGPT-3.5、GPT-4oまで「主要LLM11種」の特徴は? 中編:LLMの徹底理解に欠かせない「

                                                  GPT、Geminiだけじゃない 押さえておきたい「主要LLM」8選はこれだ
                                                • rinna、Llama 3の日本語継続事前学習モデル「Llama 3 Youko 8B」を公開|rinna株式会社

                                                  Llama 3の高いテキスト生成能力を日本語にいち早く導入 rinna株式会社 (本社:東京都渋谷区/代表取締役:宋 珠憲、以下rinna) は、Llama 3 8Bに対して日本語データで継続事前学習を行った「Llama 3 Youko 8B」を開発し、Meta Llama 3 Community Licenseで公開したことを発表します。 ■ rinnaのモデル公開活動 最近のAI技術は、世界中の研究・開発者が切磋琢磨し、成果を共有・公開することで劇的に進化を遂げています。rinnaも、日本語のタスクに適したGPT・BERT・HuBERT・CLIP・Stable Diffusionなど、テキスト・音声・画像に関する事前学習済み基盤モデルを公開してきました。2021年4月からHugging Faceに公開してきたrinnaのモデルは累計560万ダウンロード・1000 Likesを超え、多く

                                                    rinna、Llama 3の日本語継続事前学習モデル「Llama 3 Youko 8B」を公開|rinna株式会社
                                                  • 新清士の「メタバース・プレゼンス」

                                                    2024年04月01日 07時00分 AI 第59回 政府、生成AI推進に向けて議論を加速 年度の終わりを迎え、今後の日本のAI政策がどのような方向になるのかが、明確になってきた。昨年5月の「広島AIプロセス」の取りまとめから始まり文化庁、総務省・経産省、内閣府と個別省庁で行われていた議論の最終案がまとまってきため。 2024年03月25日 07時00分 AI 第58回 画像生成AIで同じキャラクターが簡単に作れるようになってきた Midjourneyに1枚の画像から似た画像を作れる新機能「Creative Reference」が追加。ベースになった技術「IP-Adapter」も発展を遂げ、いわゆる「LoRA」も作りやすくなってきた。将来的には文字や音声から“同じ人物”が生成できるようになりそうだ。 2024年03月18日 07時00分 AI 第57回 日本発のリアルタイム画像生成AIサー

                                                      新清士の「メタバース・プレゼンス」
                                                    • 「これは芸術の死だ」AI画像生成がアートコンテストで優勝してしまった…もう法整備を待てない、この流れは誰にもとめられないのか(集英社オンライン) - Yahoo!ニュース

                                                      2022年11月30日に「ChatGPT」が無料公開され、瞬く間に世界中から注目を集めた。ChatGPTは当初は文章を自動で生成するAIとして登場したが、今や画像や音楽などを自動で生成するAIも次々と登場。その変遷を見てみよう。 【関連書籍】『アフターChatGPT 生成AIが変えた世界の生き残り方 』 「画像生成AI」が描いた絵画が…コンテストで優勝トランスフォーマーの登場によって飛躍的な進歩を遂げたのは、対話型AIだけではありません。2022年以降、作成したい画像のイメージをテキストで指示すると自動で画像を生成する「画像生成AI」も急速に進化を遂げています。 オープンAIも2021年に「DALL・E(ダリ)」という画像生成AIを発表しており、翌年4月には「DALL・E 2」を発表していますが、ブームに火が点いたのは、2022年6月にリリースされた「Midjourney(ミッドジャーニー

                                                        「これは芸術の死だ」AI画像生成がアートコンテストで優勝してしまった…もう法整備を待てない、この流れは誰にもとめられないのか(集英社オンライン) - Yahoo!ニュース
                                                      • Stability AI、画像生成AI「Stable Diffusion」の機能を大幅向上——画像構成要素増も、プロンプトの長さはそのままで - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                        Image credit: Stability AI Stability AI は26日、画質を劇的に向上させ、テキストプロンプトだけで非常に詳細な画像を生成できる、新しい Stable Diffusion ベースモデルをローンチした。 Stable Diffusion XL(SDXL)1.0 は、Stability AI が新たに開発した最先端のフラッグシップモデルだ。このリリースは、Midjourney や最近「Firefly」でこの分野に参入した Adobe のようなライバルとの競争に直面している Stability AI がその能力をレベルアップし、モデルをオープン化することを目的として行われた。 Stability AI は、6月から SDXL 1.0 の機能をプレビューしており、このモデルのパワーを実証するための研究専用リリースを発表している。今回の機能強化では、画像精製プロセ

                                                          Stability AI、画像生成AI「Stable Diffusion」の機能を大幅向上——画像構成要素増も、プロンプトの長さはそのままで - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                        • Stability AI、16億パラメータの日本語LLM。速度と性能を両立

                                                            Stability AI、16億パラメータの日本語LLM。速度と性能を両立
                                                          • 東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の 大規模言語モデル“Weblab-10B”を公開 ―公開済みの日本語大規模言語モデルで最高水準―

                                                            プレスリリース 研究 2023 2023.08.22 東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の 大規模言語モデル“Weblab-10B”を公開 ―公開済みの日本語大規模言語モデルで最高水準― 東京大学大学院工学系研究科技術経営戦略学専攻松尾研究室(教授:松尾 豊、以下「松尾研」)は、この度日本語・英語の2ヶ国語に対応した100億パラメータサイズの大規模言語モデル(Large Language Model ;LLM)を事前学習と事後学習(ファインチューニング)により開発し、モデルを公開しましたのでお知らせします。今後も、Weblab-10Bのさらなる大規模化を進めるとともに、この資源を元に、LLMの産業実装に向けた研究を推進して参ります。 松尾研は、知能の謎を解くことを目的に人工知能の研究に取り組む研究室です。現在はテキスト生成で注目されることの多いLLMの技術ですが

                                                            • Stable Diffusion開発元のStability AIがモデルを商用利用するための有償メンバーシップを発表

                                                              by Jernej Furman 画像生成AI「Stable Diffusion」を開発するStability AIが、顧客が同社のモデルを商業利用する方法を標準化し、有償メンバーシッププランを開始すると発表しました。Stability AIによると、この有償メンバーシップは収益性とオープン性のバランスをとることを目的としており、ユーザーに商業利用する権利を付与する方法を「再定義」するものだとしています。 Memberships — Stability AI https://stability.ai/membership Stability AI メンバーシップのご紹介 — Stability AI Japan https://ja.stability.ai/blog/stability-ai-membership Stability AI announces paid membershi

                                                                Stable Diffusion開発元のStability AIがモデルを商用利用するための有償メンバーシップを発表
                                                              • Stable Audio Open — Stability AI

                                                                Key Takeaways: Stable Audio Open is an open source text-to-audio model for generating up to 47 seconds of samples and sound effects. Users can create drum beats, instrument riffs, ambient sounds, foley and production elements. The model enables audio variations and style transfer of audio samples. We’re excited to announce Stable Audio Open, an open source model optimised for generating short audi

                                                                  Stable Audio Open — Stability AI
                                                                • 音楽生成AI「Stable Audio」を試すが、道はまだまだ長そうだ (1/2)

                                                                  現在のAIブームのきっかけは、画像生成AIがブレークしたことだ。 あまりにもリアルで人間が描いたものを凌駕するような絵画をAIが描いたことで話題を呼んだ。今では様々な画像生成AIが登場しているが、その中心は「Stable Diffusion」という画像生成AIだ。複数の研究者によって開発され、Stability AIという会社が提供したものだが、そのStability AIが今度は「Stable Audio」という音楽生成AIを発表した。つまり話題の画像生成AIの大手が手がけた音楽生成AIということになる。 1万9500時間以上の音楽データから学習した音楽生成AI Stable Audioは、グーグルの「MusicLM」やメタの「MusicGen」のように、プロンプト(指示文)に基づいて音楽を作り出す本格的な生成AIだ。Diffusionは拡散モデルを意味し、浮き上がるようなステップを経て

                                                                    音楽生成AI「Stable Audio」を試すが、道はまだまだ長そうだ (1/2)
                                                                  • 最高性能の、日本語画像言語特徴抽出モデル「Japanese Stable CLIP」をリリースしました — Stability AI Japan

                                                                    Stability AI は商用利用可能な日本語画像言語特徴抽出モデル「Japanese Stable CLIP」をリリースしました。モデル単体では、ゼロショット画像分類(事前にクラス情報を学習せずに画像分類)や任意のテキストから画像を検索する画像検索などに用いることができます。また、他のモデルと組み合わせることで、text-to-image や image-to-text といった生成タスクに拡張することが可能です。 Japanese Stable CLIP 「Japanese Stable CLIP」は、日本らしい画像や日本語に特化した画像言語特徴抽出モデルです。学習には、最新手法である SigLIP の手法を用いており、オープンソースになっている日本語対応CLIPモデルの中で、最も高いスコアを達成しています。

                                                                      最高性能の、日本語画像言語特徴抽出モデル「Japanese Stable CLIP」をリリースしました — Stability AI Japan
                                                                    • Evaluate the reliability of Retrieval Augmented Generation applications using Amazon Bedrock | Amazon Web Services

                                                                      AWS Machine Learning Blog Evaluate the reliability of Retrieval Augmented Generation applications using Amazon Bedrock Retrieval Augmented Generation (RAG) is a technique that enhances large language models (LLMs) by incorporating external knowledge sources. It allows LLMs to reference authoritative knowledge bases or internal repositories before generating responses, producing output tailored to

                                                                        Evaluate the reliability of Retrieval Augmented Generation applications using Amazon Bedrock | Amazon Web Services
                                                                      • AWS re:Invent 2023 3日目のアプデ特集(生成AIモデル、ベクターDB等) - Qiita

                                                                        クラウドサービスAWSで最大の年次カンファレンス「AWS re:Invent」が2023年も開幕しました🎉 私は昨年までオンライン配信で楽しんでいましたが、今年は初めて現地ラスベガスに訪問できましたので、会場でしか聞けないナマ情報も含めてお届けします! 初日・2日目分はこちらをどうぞ。 3日目のキーノートはAI担当Vice Presidentからの発表! 水曜朝は例年、AWSのVP スワミさんから機械学習・分析関連の新機能などがお披露目されます。 すでにYouTubeでアーカイブ動画も公開されています。 大きめの発表は以下でした Amazon Bedrock関連 Amazon BedrockにClaude 2.1がリリース Amazon BedrockにLlama 2の70Bモデルがリリース Amazon Titan Multimodal Embeddings Amazon Titan

                                                                          AWS re:Invent 2023 3日目のアプデ特集(生成AIモデル、ベクターDB等) - Qiita
                                                                        • 日本語LLMのベンチマーク:「JGLUE」と「Rakuda Benchmark」|Baku

                                                                          LINEの「japanese-large-lm-instruction-sft」リリースに関する公式ブログで「Rakuda Benchmark」という日本語LLMベンチマークがモデルの性能評価に使われていた。 これまで日本語LLMのリリースでよく見たのは「JGLUE(日本語一般言語理解評価)」というベンチマーク。何が違うのか簡単に調べてみた。 JGLUE(日本語一般言語理解評価)「JGLUE」は、早稲田大学とYahoo! JAPANが構築・公開したベンチマーク。 ベンチマークの具体的な構成については、以下の記事に詳しい。 この「JGLUE」のスコアでLLMの日本語性能をランク付けしたリーダーボードには、「Nejumi LLMリーダーボード」や、Stability AIによる「JP Language Model Evaluation Harness」がある。 Nejumi LLMリーダーボー

                                                                            日本語LLMのベンチマーク:「JGLUE」と「Rakuda Benchmark」|Baku
                                                                          • Japanese Stable CLIPを使って画像の感情判断ができるAPIをModalを使って実装する

                                                                            はじめに 以下のポストの通りStability AIが「Japanese Stable CLIP」を公開されたので、画像の内容を感情分析ようにしたい & ほかからでも使えるようにAPIを実装しました バックエンドのGPUサーバーレスには、最近ハマっているModalを使っていきます Modalを使ってLCMを使ったdiscordコマンドを実装した内容は以下で書いています! 環境 Modal Python3.10 ライブラリ modal 実装 Modal側で動くAPIを実装します from modal import Stub, web_endpoint import modal stub = Stub("clip_api") emotions = [ "喜び", "悲しみ", "怒り", "驚き", "恐怖", "愛情", "幸福", "落胆", "焦燥", "安心", "羨望", "憎悪",

                                                                              Japanese Stable CLIPを使って画像の感情判断ができるAPIをModalを使って実装する
                                                                            • Windows 10用「Copilot in Windows」がリリースプレビューに/Stability AIが動画生成AI「Stable Video Diffusion」をプレビュー公開

                                                                              Windows 10用「Copilot in Windows」がリリースプレビューに/Stability AIが動画生成AI「Stable Video Diffusion」をプレビュー公開:週末の「気になるニュース」一気読み!(1/3 ページ) うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、11月19日週を中心に公開された主なニュースを一気にチェックしましょう!

                                                                                Windows 10用「Copilot in Windows」がリリースプレビューに/Stability AIが動画生成AI「Stable Video Diffusion」をプレビュー公開
                                                                              • Amazon Bedrock正式リリースの公式ブログを日本語で簡潔にまとめました - Qiita

                                                                                これです。英語ですし長いですよね。サマりました。 内容まとめ はじめに 本日(※米国時間9/28)、Amazon Bedrockが一般提供(GA)となった。 4月にアナウンスされていた各社提供の基盤モデル(AI21 Labs, Anthropic, Cohere, Stability AI, Amazon)に加え、Meta社のLlama 2モデルもまもなく提供予定。 Bedrockのおさらい サーバーレスのためインフラ管理不要 Bedrockは基盤モデルをプライベートにカスタムできる(ファインチューニング、RAG等) Bedrock Agent機能もプレビューで提供中 CloudWatchで利用状況メトリクスの可視化が可能 CloudTrailでAPI利用の監査ロギング、トラブルシュートが可能 GDPR準拠のアプリ開発や、HIPAA規制の機密なシステムにも利用できる 実際に使ってみる Be

                                                                                  Amazon Bedrock正式リリースの公式ブログを日本語で簡潔にまとめました - Qiita
                                                                                • 『すべてはQになる』 re:InventでAWSのCEOのAdam Selipskyによるキーノートを聞いて(2023年版) - NRIネットコムBlog

                                                                                  こんにちは、佐々木です。11月27日からre:Inventが始まっていて、今年も開催地であるラスベガスでリアルタイムで参加しています。そして、28日の朝に一番メインであるCEOのAdam Selipskyによるキーノートが発表されました。簡単なまとめと感想にはなりますが、記事としてまとめました。 生成系AIとAmazon Q 今年のキーノートは事前の予想通りAI、特に生成系AIについてがメインの関心事項となっていました。MicrosoftとOpenAIの連合に対抗して、Amazon Bedrockを中心にサービスを展開しています。Amazon Bedrockは生成系のAIで、モデルはユーザー自身で選べます。AWS自身が開発したモデルの他に、AI21 Labs、Anthropic、Cohere、Meta、Stability AIなどサードパーティのモデルを選択して組み込むことができます。つま

                                                                                    『すべてはQになる』 re:InventでAWSのCEOのAdam Selipskyによるキーノートを聞いて(2023年版) - NRIネットコムBlog