「"Stability AI"」を検索 - はてなブックマーク

1 - 40 件 / 367件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

"Stability AI"の検索結果1 - 40 件 / 367件

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
- 1038 users
- ascii.jp
- テクノロジー
- 2023/12/11
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi
ChatGPTを「作業者」にすると自分が成長できない　深津貴之氏が解説する、スキルアップにつながる生成AI活用術
- 401 users
- logmi.jp
- テクノロジー
- 2023/12/13
「AIとビジネス」をテーマに、業種業態、部署の垣根を超え、産業を活性化するヒントを得るためのビジネスカンファレンス「Gen AI EXPO」（主催：弁護士ドットコム株式会社）。今回は、生成AIのエヴァンジェリストとして活躍し、「深津式プロンプト」を編み出し世に広めた深津貴之氏が登壇した特別セッション「ChatGPT活用術」の模様をお伝えします。深津式プロンプトの誕生や、自分を成長させるためのChatGPTの使い方などが語られました。「ChatGPT」と言えばの深津貴之氏が登壇田上嘉一氏（以下、田上）：本セッションをご視聴のみなさん、こんにちは。弁護士ドットコムの田上と申します。今日は深津さんをお招きしてAIアシスタントの活用方法というテーマでお話ししていきたいと思います。深津さんに関してはもうご紹介する必要もないかなと思いますが、クリエイター集団THE GUILDの代表とnoteのC
- ChatGPT
- AI
- あとで読む
- 人工知能
- 仕事
- 考え方
- プレゼン
- 機械学習
- IT
ChatGPT開発に必要なGPUは3万基、日本の国策AI基盤は1千基。目前に迫る日本のAI敗戦
- 383 users
- wirelesswire.jp
- テクノロジー
- 2023/08/19
ChatGPT開発に必要なGPUは3万基、日本の国策AI基盤は1千基。目前に迫る日本のAI敗戦 2023.08.19 Updated by Ryo Shimizu on August 19, 2023, 16:47 pm JST そろそろ業界の最深部でしか知られてなかった事実がニュースになって来始めているのでここで本当の問題を明らかにしておきたい。 AI開発に必須なのは、計算資源である。そしてこれは現在のところ、事実上NVIDIAが一社独占している。 NVIDIA以外の半導体がいくら「AIに特化しています」と能書きを垂れていてもごくわずかな例外を除いてはほとんど全部が誇大広告である。たとえばApple Silliconは、「ニューラルエンジン」と称するモジュールを内蔵しているが、これを使ってAIの学習をすると、なんとCPUよりも遅い。信じられないかもしれないが、これが残酷な事実なのである
- AI
- GPU
- 日本
- あとで読む
- ChatGPT
- 人工知能
- NVIDIA
- 開発
- IT
- 企業
GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ
- 355 users
- www.itmedia.co.jp
- テクノロジー
- 2023/08/18
米Googleの著名な2人の元研究者、リオン・ジョーンズ氏とデビッド・ハー氏が8月17日、東京に拠点を置く新AI企業を設立したとX（旧Twitter）で発表した。ジョーンズ氏は、Googleが2017年に発表した生成AI革命のきっかけとなったと評価されている論文「Attention Is All You Need」（PDF）の8人の著者の1人。この論文では、後にChatGPTなどの製品開発の基礎となった深層学習アーキテクチャー、Transformerを紹介している。ジョーンズ氏は8月に10年以上勤めたGoogleを退社した。これで論文を書いた著者全員がGoogleからいなくなった。ハー氏は2016年にGoogle Brain入りし、機械学習などの研究に取り組んだ後、2017年にGoogle Brainが東京チームを設立した際、そのトップとして来日した。2022年にGoogleを辞め、S
- AI
- あとで読む
- google
- 人工知能
- 研究
- 企業
- 東京
- ビジネス
- business
- technology
「このカップル、絵面が濃い」──オタ恋の“AI広告”が話題　運営「女性入会者数が3～7倍増えた」　そのワケは
- 342 users
- www.itmedia.co.jp
- テクノロジー
- 2023/10/05
肥満体形の男性と、可愛らしい女性のツーショット写真──そんな画像広告をX（Twitter）上で見かけたことはないだろうか。これは「オタ恋」というオタク同士の出会いを支援する恋愛マッチングアプリが展開するAI画像を使った広告だ。「このオタクカップル、絵面が濃い」と思わずツッコミを入れてしまいそうな内容で、じわじわと話題になっている。オタ恋は2022年11月にサービスを開始し、23年5月から画像生成AIを使った広告を展開している。この広告の効果について、運営会社であるエイチエムシステムズ（東京都新宿区）は「男性は1.5～2倍程度、女性は3～7倍程度、入会者が増加した」と反響を話す。入会者数が増加した理由について、同社は「AI広告素材がバズる事により認知度が上がり信用が増した可能性がある」と分析する。「マッチングアプリで女性が利用する際、安全性や信頼性、知名度などを重視する声が上位にきており
- AI
- 広告
- 人工知能
- 画像
- あとで読む
- オタク
- 男女
- Stable Diffusion
- ネタ
- techfeed
音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成　プロの音楽家も「これはヤバい」と驚愕
- 317 users
- www.itmedia.co.jp
- テクノロジー
- 2023/12/14
音楽生成AI「Suno AI」がX（旧Twitter）上で話題になっている。歌詞や曲調を文章で指示するだけで音楽を自動生成するサービスで、PCやスマートフォンのWebブラウザ上から利用できる。生成した音楽の出来栄えには、プロの音楽家からも驚きの声が上がっている。 Suno AIは、米国を拠点とする音楽家とAIの専門家たちからなる米Sunoが運営するサービス。開発者の中には、米MetaやTikTokを運営する中国ByteDanceなどに所属していた人たちもいるという。利用にはGoogleやMicrosoft、Discordのアカウントが必要で、12月14日時点ではβ版を提供中。1日5回まで無料で音楽を生成できる他、有料プランもある。早速使ってみた　そのお手並みは？記者も試しに利用してみた。メニューにある「Create」を押し、「記事を書くのがはかどる音楽を作成してください」と指示を入れた
- AI
- 音楽
- あとで読む
- 生成AI
- 人工知能
- music
- ビジネス
- 文章
- ITmedia
音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan
- 302 users
- ja.stability.ai
- テクノロジー
- 2023/09/13
Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。 Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。 StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、St
- AI
- あとで読む
- 音楽
- music
- 生成AI
- audio
- 機械学習
- DTM
- 人工知能
- 技術
もし明日、上司に「GPT-4を作れ」と言われたら？　Stability AIのシニアリサーチサイエンティストが紹介する「LLM構築タイムアタック」
- 299 users
- logmi.jp
- テクノロジー
- 2023/12/04
オープンLLMの開発をリードする現場の視点から、開発の実情や直面する課題について発表したのは、Stability AI Japan株式会社の秋葉拓哉氏。Weights & Biasesのユーザーカンファレンス「W＆Bカンファレンス」で、LLM開発のポイントを紹介しました。全2記事。前半は、LLM構築タイムアタック。「GPT-4を作ってください」と言われたらどう答える？秋葉拓哉氏：みなさん、こんにちは。秋葉と申します。それでは、発表させていただきたいと思います。みなさん、さっそくですが、「GPT-4」ってすごいですよね。ここにいらっしゃっている方々はこれについては、もう疑いの余地なく、同意してくださるかなと思います。では、質問なんですが、もし「GPT-4を作ってください。予算はあるんだよ」と上司に言われたら、どう答えますか？　ということをちょっと聞いてみたいですね。これはけっこう意
- LLM
- AI
- あとで読む
- ChatGPT
- GPT
- 人工知能
- 画像生成AI
- 文章生成AI
- 学習
- techfeed
商用利用OKの画像生成AI「Emi」公開　クリエイターと対話して開発、無断転載画像不使用
- 244 users
- www.itmedia.co.jp
- テクノロジー
- 2023/09/27
「AIいらすとや」など、権利クリアな画像生成AIを開発してきたAI Picasso社は、アニメ・マンガ風のイラストを生成できる画像生成AI「Emi」（Ethereal master of illustration）を9月25日に無償公開した。 Stable Diffusionベース。追加学習で無断転載画像を学習させておらず、権利がクリアな点が特徴。商用利用も可能だ。 Stable Diffusion XL 1.0と NVIDIAのGPU「H100」に、同社のノウハウを組み合わせて開発。最近の画風になるよう調整した。追加学習に「Danbooru」などの無断転載サイトを使っていない。クリエイターの意見を聞きながら開発したという。同社の従来のモデルと異なり商用利用可能にした。画像生成AI普及に伴い、創作業界に悪影響を及ぼさないようマナーを守る人が増えてきたことや、他の画像生成AIが商用可能な
- AI
- あとで読む
- 画像
- 人工知能
- 学習
- 開発
- 画像生成
- Adobe
- 画像生成AI
- 著作権
日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
- 234 users
- ja.stability.ai
- テクノロジー
- 2023/08/17
Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な
- AI
- LLM
- あとで読む
- 画像
- 機械学習
- 日本語
- 人工知能
- 生成AI
- 日本
- イラスト
「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
- 206 users
- tech.connehito.com
- テクノロジー
- 2023/12/09
※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。はじめにこの記事はコネヒトアドベントカレンダー 8日目の記事です。コネヒト Advent Calendar 2023って？コネヒトのエンジニアやデザイナーやPdMがお送りするアドベントカレンダーです。コネヒトは「家族像」というテーマを取りまく様々な課題の解決を目指す会社で、ママの一歩を支えるアプリ「ママリ」などを運営しています。 adventar.org こんにちは！コネヒトの機械学習エンジニア y.ikenoueです。突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS
- aws
- あとで読む
- 検索
- 開発
- AI
- rag
- Generative AI
- LLM
- amazon
AI時代に起業するということ｜shi3z
- 205 users
- note.com/shi3zblog
- テクノロジー
- 2024/04/10
生成AI以前と以後で、会社のあり方は決定的に変化していくのだと思う。たとえば、昨日はとある会議で、「この(AI)サービスの原価はいくらか」という議論が沸き起こった。 AIサービスなのだから、AIの利用料くらいしかかからないかというとそうでもない。実際、AIを動かすためにはAIそのものにかかるお金以外の人件費がかかる。誰かに売る人の人件費や、システム開発のための人件費や、サポートのための人件費だ。ただ、AIサービスの場合、人件費を極限まで最小化することができる、という点が決定的に違う。また「AIの利用料」も、「APIの利用料」なのか、ベアメタルサーバーの月額利用料なのか、それとも自社に持っているGPUマシンの電気代なのか、という議論のポイントがある。あまり多くの人は語らないことだが、実は起業には再現性がある。つまり、一度でも事業をうまく立ち上げたことがある経験を持つ人は、次も事業をう
Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開／テキストだけでなくアップロードしたオーディオから音楽を生成可能に
- 200 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/04/04
- AI
- あとで読む
- 音楽
- Stability AI
- 人工知能
- music
- 音声処理
- 無料
- オーディオ
- *あとで読む
日本語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました — Stability AI Japan
- 174 users
- ja.stability.ai
- テクノロジー
- 2024/05/09
ポイント Japanese Stable LM 2 1.6B（JSLM2 1.6B）は16億パラメータで学習した日本語の小型言語モデルです。 JSLM2 1.6Bのモデルサイズを16億パラメータという少量にすることによって、利用するために必要なハードウェアを小規模に抑えることが可能であり、より多くの開発者が生成AIのエコシステムに参加できるようにします。ベースモデルとしてJapanese Stable LM 2 Base 1.6Bと、指示応答学習（Instruction tuning）済みのJapanese Stable LM 2 Instruct 1.6Bを提供します。両モデルともStability AI メンバーシップで商用利用が可能です。また、どちらのモデルもHugging Faceからダウンロードすることができます。 Japanese Stable LM 2 Base 1.6B
- AI
- あとで読む
- LLM
- 人工知能
- 学習
- 自然言語処理
- 日本語
- japan
- IT
何故日本のAI技術は中国人に完全敗北したのか？｜瑞島フェレリ
- 164 users
- note.com/felelihasima
- テクノロジー
- 2023/12/02
はじめに自分は去年の今頃（2022年12月）に、「AIアートとMMDについて。金は著作権より重い。」という記事を書いた。 https://archive.is/l9iKV その記事を書いたら、「MMDは日本の3DCGを破壊してしまった」という記事も合わせてバズった。「MMDは日本の3DCGを破壊してしまった（2022年度版）2022/08/16加筆」 https://archive.is/DenAN 2018年に日本の3DCGがMMDでガラパゴス化したと指摘され、およそ3年が経過した。現在の日本の3DCGはどうなってしまったのか？結論から言えば中国（ビリビリ動画）に日本の3DCG（ニコニコ動画）は完全に追い抜かれてしまった。日本の白物家電が中国・韓国製に駆逐されたのと同じように、世界から完全に取り残されてしまったのだ。 MMDは日本の3DCGを破壊してしまった（2022年度
- AI
- 中国
- あとで読む
- 生成AI
- オタク
- 日本
- 技術
- 人工知能
無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない
- 153 users
- ascii.jp
- テクノロジー
- 2024/06/27
Invoke、Comfy Org、Civitai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。企業による技術の独占を防ぎ、アクセシビリティを確保「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivitai、大規模な学習データセットを構築するLAIONだ。彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ (1/4)
- 134 users
- ascii.jp
- テクノロジー
- 2024/07/15
発表後、悪い意味で話題になってしまっていた画像生成AI「Stable Diffusion 3 Medium（SD3M）」に動きがありました。開発元のStability AIは、Weta Digitalの元CEOのプレム・アッカラジュ（Prem Akkaraju）氏がCEOに就任し、新たな資金も調達しました。これで組織として当座の危機は脱したと言えそうです。また、Stable Diffusion 3（SD3）のライセンスについての変更を打ち出してきました。果たして失われた信頼は取り戻せるでしょうか。人気モデル「Pony Diffusion」開発者との対立基本的な情報からすると、やはり、SD3Mはコケたと言っていい状況です。参考情報となりますがGoogleトレンドを見てみると、6月12日のリリース直後は1日で150万ダウンロードされるほど注目を集めていたものの、すぐにシュリンクしてしまって
LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog
- 123 users
- engineers.ntt.com
- テクノロジー
- 2023/09/25
こんにちは、イノベーションセンターの杉本（GitHub：kaisugi）です。普段はノーコードAI開発ツール Node-AI の開発に取り組む傍ら、兼務1で大規模言語モデル（LLM:Large Language Model）について調査を行なっています。特に、日本語を中心に学習された LLM への関心があり、awesome-japanese-llm という日本語 LLM をまとめた Web サイトのメンテナンスにも取り組んでいます。今回は、LLM に LLM の評価そのものを行わせるという新たなアプローチ（LLM-as-a-judge）についてご紹介します。 ChatGPT の登場以降、国内外で LLM の開発競争が進行しており、モデルの重みが公開されたオープンなモデルも続々と現れています。そのような中で、新しいモデルの構築だけでなく、どのモデルが優れているかを比較検討することが今後ます
GPT-4、Microsoft 365 Copilot、日本語LLM…　2024年も追い続けたい「生成系AI」のおすすめ記事5選
- 119 users
- logmi.jp
- テクノロジー
- 2024/01/02
GPT-4の発表から、より一層注目を浴びるようになった生成系AI。2023年には数々のイベントで生成系AIについて語られていました。そこで今回は、2023年に掲載したログミーTechの記事から、今あらためて読み返したい生成AI系の記事を5つピックアップしました。「今の生成系AIは“人間人間したもの”を生み出している」　スクエニ・三宅陽一郎氏が語る「第3次AIブーム」の盛り上がり米国OpenAI社が公開した「ChatGPT」が盛り上がりを見せている中、議論されがちなのは“AIの脅威”。それではエンジニアやプログラマーにとって、AIは脅威なのでしょうか？それとも新たな相棒なのでしょうか？　今回は、株式会社スクウェア・エニックスのジェネラル・マネージャーリードAIリサーチャーである三宅陽一郎氏に、AIの一般化によるエンジニア、そして人類の未来についておうかがいしました。全3回。1回目は、三
- AI
- あとで読む
- 人工知能
- techfeed
- microsoft
- 開発
AIの歴史と現在の問題 - デマこい！
- 119 users
- rootport.hateblo.jp
- テクノロジー
- 2024/04/14
ジョン・ヘンリーの教訓 19世紀の都市伝説に「ジョン・ヘンリー」という人物がいます[１]。彼は屈強な肉体労働者で、ハンマーを振るって岩に穴を開ける達人でした。ところが蒸気機関で動くドリルの登場により、彼は失業の危機に瀕します。そこで彼は、人間は機械よりも優れていることを示すために、穴開け競争で蒸気ドリルに戦いを挑んだというのです。伝説によれば、ジョン・ヘンリーは（驚くべきことに）僅差で勝利を収めたとされています。しかし、あまりにも肉体を酷使したために、勝利の直後にその場で倒れて帰らぬ人になりました。周囲の野次馬たちは言いました。「彼は人間らしく死んだ」と。この逸話から得られる教訓は何でしょうか？「機械と競い合うのは命にかかわる」とか「バカバカしい」とかではないと私は思います。それはあまりにも表層的な解釈です。生成ＡＩが躍進する現在、ジョン・ヘンリーは遠い過去の伝説ではありません。現
- AI
- 人工知能
- 歴史
- あとで読む
- history
- 仕事
- 労働
- 技術
- techfeed
洗濯物折りたたみロボット、蹴られても二本足で踏ん張るロボット…中国のAI大会に人型ロボット25種類が集結 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
- 115 users
- 36kr.jp
- テクノロジー
- 2024/08/13
2024年世界人工知能大会（WAIC）が7月4日より上海市で開催され、過去最多となる500余りの企業が出展した。新たに開設されたロボットエリアでは、書道ロボット、ツボ押しマッサージをするロボット、衣類をたたむロボットなど25種類の人型ロボットが登場し、今大会で最も注目を集めた。テスラ：第2世代「Optimus」は展示のみテスラは人型ロボットの第2世代「Optimus Gen 2」を出展。デモ動画公開から7カ月後の登場は大きな注目を浴びた。テスラのスタッフによると、Optimus Gen 2は直立歩行を基本とし、初代に比べ歩行速度が30％向上した。また10本の指には触覚センサーを搭載し、扱いに注意が必要な卵をそっとつかめるだけでなく、重い箱を運ぶこともできる。テスラはこのロボットを人間の代わりとすべく、人間の動作を真似てバッテリーの仕分けを訓練するなど、自社のEV工場で試験的に使用して
- ロボット
- 中国
- 技術
- あとで読む
- AI
- メディア
Stable Diffusion 3 — Stability AI
- 105 users
- stability.ai
- テクノロジー
- 2024/02/22
Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy Announcing Stable Diffusion 3 in early preview, our most capable text-to-image model with greatly improved performance in multi-subject prompts, image quality, and spelling abilities. While the model is not yet broadly available, today,
AIイラスト始め方の網羅的案内 2024年版 / だいたい未経験者向け｜かいりん
- 103 users
- note.com/kairin__
- テクノロジー
- 2024/03/09
前書き🤔これは何RIZさんという一見AIイラストレーターを装った風来のシレン廃人にそそのかされて作ったちちぷいチャレンジが多数の愉快犯たちにおもちゃにされた結果書かないといけなくなった記事です。 Stable DiffusionやMidjourney、Nijijourney、NovelAIの使い方を詳しく解説した文書は数あれど、ふだんパソコンを使わない一般の人向けまで踏み込んで網羅している解説記事って案外ないかもな？と思ったのもきっかけではある！書く前からわかってたんだけどボリュームがヤバいので稚拙な表現や抜け漏れ多数だ。公開後もちょくちょく手を加える可能性大だから、もし更新が気になるようであれば筆者のX, Blueskyアカウントをフォローするなり、気が向いた時にこのnoteに戻ってきてくれよな！！しばらく前提条件を書いておくので、とっとと中身を読みたい人は飛ばしちゃってください。
- イラスト
- AI
- 画像
- あとで読む
- ChatGPT
- Adobe
- 機械学習
画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた
- 95 users
- gigazine.net
- テクノロジー
- 2023/08/23
2023年7月に公開された「Stable Diffusion XL 1.0(SDXL 1.0)」は既存のStability AI製モデルと比べて高品質な画像を生成できるだけでなく、LoRAによる生成画像の調整にも対応しています。データサイエンティストのマックス・ウルフ氏は「悪い例」を集めて作成したLoRAを用いてSDXL 1.0による生成画像の品質をさらに向上させる手法を考案し、LoRAファイルおよび誰でも試せるデモを公開しています。 I Made Stable Diffusion XL Smarter by Finetuning it on Bad AI-Generated Images | Max Woolf's Blog https://minimaxir.com/2023/08/stable-diffusion-xl-wrong/ LoRAは参考となる画像を集めて絵柄や服装などを追
噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想｜shi3z
- 94 users
- note.com/shi3zblog
- テクノロジー
- 2024/05/08
最近にわかに話題のLLMツール「Dify」を僕も使ってみた。いいところと「?」となったところがあったので纏めておく Difyとは、GUIでワークフローを組むことができるLLM-OPSツールだ。 ComfyUIのようにワークフローが組めたり、GPTsのように自分専用のアシスタントを作れたりできる。特に、OpenAIのGPTシリーズとAnthropicのClaude-3、そしてCohereのCommand-R+なんかを組み合わせて色々できるところは良いところだと思う。また、ローカルLLMにも対応しているので、企業内でのチャットボットを作るんだったらGPTsよりこっちの方がいいだろう。元々色々なテンプレートが用意されているが、テンプレだけ使うとGPTsっぽいものを作れる(それだってすごいことだが)。テンプレを改造するだけでも欲しいものが作れる人はいるし、ここはノーコード環境と言えるテンプ
- AI
- Dify
- LLM
- あとで読む
東大松尾研、日英対応の大規模言語モデル公開　100億パラメータ、精度は「国内オープンソース最高水準」
- 93 users
- www.itmedia.co.jp
- テクノロジー
- 2023/08/18
東京大学院工学系研究科・松尾研究室（主宰：松尾豊教授）は8月18日、日英の2カ国語に対応した100億パラメータサイズの大規模言語モデル（LLM）「Weblab-10B」を、事前学習と事後学習（ファインチューニング）により開発し、非商用ライセンスでモデルを無料公開した。【修正履歴：2023年8月18日午後9時　当初、モデルの公開形式をオープンソースと記載していましたが、ソースコードが公開されていないなどオープンソースの定義に沿わないと思われる部分があるため記述を改めました。なお、引用部分についてはそのままにしています】日本語だけでなく英語のデータセットも学習に用いることで学習データ量を拡張し、言語間の知識転移を行うことで日本語の精度を高めたのが特徴。事前学習には、代表的な英語のデータセット「The Pile」と日本語のデータセット「Japanese-mC4」を使用。事後学習には、Alp
- AI
- LLM
- あとで読む
- 機械学習
Stable DiffusionとMidjourneyはどちらが優れている？「画像生成AI」の可能性と課題
- 89 users
- www.sbbit.jp
- テクノロジー
- 2023/08/29
画像生成AI二強の最新動向マイクロソフトの検索エンジンBingで画像生成機能が追加されたほか、デザインプラットフォームCanvaでも画像生成が可能になるなど、生成AI技術を活用した画像生成ツールが身近な存在になりつつある。この画像生成領域を牽引してきたのは、Stable Diffusionを展開するStability AI（ロンドン拠点）とMidjourneyを展開するMidjourney, Inc（サンフランシスコ拠点）の2社だ。 ChatGPTの開発企業として知られるOpenAIも画像生成AI「DALL-E」を開発しているが、現時点では、画像のクオリティでStable DiffusionとMidjourneyには及ばず、後塵を拝する状況となっている。そんな中、Stability AIが最新の画像生成モデルをリリース、画像クオリティがさらに向上したとして注目を集めている。 Stabi
Amazon Bedrock を利用して生成 AI でなにができるのか？を体験できる AWS のワークショップをやってみた | DevelopersIO
- 80 users
- dev.classmethod.jp
- テクノロジー
- 2023/11/24
Amazon Bedrock を利用して生成 AI でなにができるのか？を体験できる AWS のワークショップをやってみた re:Invent 2023 で開催予定の Game Day の 1 つに「Amazon Bedrock: Building with Generative AI」があります。私はこちらのイベント参加予定なのですが Amazon Bedrock を触ったことがありません。現地で焦る前に最低限のことを把握するべくAWS が提供している「生成系 AI 体験ワークショップ」をやってみました。生成系 AI 体験ワークショップ以下の環境を構築し、文章を校正してもらったり画像生成したりしました。画像引用: 生成系 AI 体験ワークショップワークショップで学べること Amazon Bedrock を利用して ChatGPT の様なチャット機能や、画像生成を Web UI を
- aws
- あとで読む
- AI
- amazon
- 人工知能
- 文章
- techfeed
コーディング支援AIツールContinueの紹介と構成例 - Qiita
- 79 users
- qiita.com/SH2
- テクノロジー
- 2024/04/06
Continueというコーディング支援AIツールの紹介です。コーディング支援AIツール・サービスとしてはGitHub Copilotが有名で、次いでCursorやCodeiumあたりが話題性のあるところかと思います。Publickeyに2024年3月時点での情報がまとまっています。 Continueはそれらと比べて知名度は劣りますが以下のような特徴があり、うまく使いこなせば有力な選択肢になると考えています。ツール本体がオープンソースである Visual Studio CodeとJetBrains IntelliJ IDEAの拡張機能がApache License, Version 2.0で提供されています言語モデルは自分で選ぶ Continueではコード補完用とチャット用で二つの言語モデルを利用しますが、そこでどの言語モデルを選ぶかは利用者側に任されています Continueを開発し
- 人工知能
- AI
- techfeed
- あとで読む
- qiita
- ツール
『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力 | テクノエッジ TechnoEdge
- 79 users
- www.techno-edge.net
- テクノロジー
- 2023/11/17
Stability AIは11月17日、「Japanese Stable Diffusion XL」（JSDXL）を公開しました。 JSDXLは、テキストで記述されたプロンプトに応じて画像を出力するText-to-Imageモデルの最新版であるStable Diffusion XL（SDXL）を日本向けに特化させたAIモデル。日本語を翻訳ではなく直接扱うことができるため、日本語特有の表現を認識し、日本の伝統的なものから現代的なものまで文化やアートを反映した高品質の画像を生成できるとしています。 ▲男子高校生のプロフィール写真（左: DALLE-3, 中央: 翻訳+SDXL, 右: JSDXL） ▲海岸沿いを走るライダー（左: DALLE-3, 中央: 翻訳+SDXL, 右: JSDXL）なお、JSDXLの学習データは、クリエイターから要求のあったオプトアウト、robots.txtや利用
3Dモデルを0.5秒で作れるAI「Stable Fast 3D」が登場したので使ってみた
- 78 users
- gigazine.net
- テクノロジー
- 2024/08/02
Stable Diffusionの開発元として知られるStability AIが、画像から3Dモデルを高速生成できるAIモデル「Stable Fast 3D」を公開しました。無料で使えるデモアプリも用意されていたので、実際に使ってみました。 Stable Fast 3Dのご紹介：単一の画像からの高速3Dアセット生成 — Stability AI Japan https://ja.stability.ai/blog/introducing-stable-fast-3d Stable Fast 3Dは2024年3月に発表された3Dモデル生成AI「TripoSR」の技術をベースに開発されたAIモデルで、7GBのVRAMを搭載したGPUなら0.5秒で3Dモデルを生成できます。すでにStable Fast 3Dを無料で使えるデモアプリがウェブ上に用意されているので、以下の画像を3Dモデル化してみま
「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました｜ELYZA, Inc.
- 75 users
- note.com/elyza
- テクノロジー
- 2024/06/26
本記事のサマリーELYZA は、「Llama-3-ELYZA-JP」シリーズの研究開発成果を公開しました。700億パラメータのモデルは、日本語の生成能力に関するベンチマーク評価 (ELYZA Tasks 100、Japanese MT-Bench) で「GPT-4」を上回る性能を達成しました。各モデルは Meta 社の「Llama 3」シリーズをベースに日本語で追加学習を行なったものです。 ■「Llama-3-ELYZA-JP-70B」 700億パラメータモデル。「GPT-4」を上回る日本語性能を達成。無料で利用可能なデモを用意しています。 ■「Llama-3-ELYZA-JP-8B」 80億パラメータと軽量ながらも「GPT-3.5 Turbo」に匹敵する日本語性能を達成。モデルを商用利用可能な形で一般公開しました。使用したAPIのバージョンなど、より詳細な評価結果については本記事の後段
- AI
- 人工知能
- LLM
- あとで読む
- 日本語
東京発・AIドリームチーム「Sakana.ai」が45億円調達　元Googleトップ研究者らが設立　AI業界の著名人や日本の大手IT企業も出資
- 71 users
- www.itmedia.co.jp
- テクノロジー
- 2024/01/16
元米Googleの著名な研究者、リオン・ジョーンズ氏とデビッド・ハー氏が東京で立ち上げたAI企業Sakana.ai（東京都港区）は1月16日、シリコンバレーのベンチャーキャピタルやNTTグループ、KDDI、ソニーグループなどから45億円の資金を調達したと発表した。調達元はシリコンバレーのベンチャーキャピタル米Lux Capitalや米Khosla Venturesに加え、日本ではNTTグループ、KDDI、ソニーグループ、ベンチャーキャピタルのみやこキャピタルやジャフコグループなども出資した。Googleで最高AI責任者を務めるジェフ・ディーン氏や、米Hugging Face創業者CEOのクレム・デラング氏、米Scale AI創業者CEOのアレックス・ワン氏といった個人からも出資を受けた。調達した資金は人材採用に充てる。国内外から優秀なITエンジニア人材を集め、日本に招致するという。さら
Amazon Bedrock の Claude と Stable Diffusion を組み合わせて簡単に画像生成 - Taste of Tech Topics
- 69 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/11/01
こんにちは、肌寒い日が続くと南の島の暖かい海に行きたくなる菅野です。 AWS上で、様々なAIモデルを利用できるようになるサービス、Amazon Bedrockがリリースされました。 Bedrockでは今までのブログで紹介してきた、テキスト生成以外にも、画像生成に利用できるモデルStable Diffusionも利用可能になっています。 Stable Diffusion自体はOSSとなっているので無料で利用できますが、自身のマシンにインストールして動かす必要があり、動かすマシンにはある程度の性能のGPUも必須になってきます。手軽にStable Diffusionをオンデマンドで利用できるのは今までにないメリットなのではないでしょうか？今回は、BedrockのClaudeV2モデルを用いて作成したプロンプトを使って、Stable Diffusionで画像生成をしていこうと思います。 Be
- AI
- あとで読む
- Bedrock
- Stable Diffusion
- aws
- 画像
- 人工知能
- Amazon
100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデル“Weblab-10B”を公開しました。 | 東京大学松尾研究室 - Matsuo Lab
- 65 users
- weblab.t.u-tokyo.ac.jp
- テクノロジー
- 2023/08/18
訂正版20230822プレスリリース東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデル“Weblab-10B”を公開 ―公開済みの日本語大規模言語モデルで最高水準（注1）― この度日本語・英語の2ヶ国語に対応した100億パラメータサイズの大規模言語モデル（Large Language Model ;LLM）を事前学習と事後学習（ファインチューニング）により開発し、モデルを公開しましたのでお知らせします。今後も、Weblab-10Bのさらなる大規模化を進めるとともに、この資源を元に、LLMの産業実装に向けた研究を推進して参ります。松尾研は、知能の謎を解くことを目的に人工知能の研究に取り組む研究室です。現在はテキスト生成で注目されることの多いLLMの技術ですが、今後は画像組み込みなどのマルチモーダル化、ブラウザ・ソフトウェア・ロボット等の行動制御の実装に発
- LLM
- oss
- 機械学習
- ai
- license
- あとで読む
- 人工知能
Stability AI、ノートPCでも動作する大規模言語モデル（LLM）を発表
- 61 users
- ascii.jp
- テクノロジー
- 2023/10/03
Stabilty.AIは10月3日、ノートPCなど計算能力のあまり高くないPCでも動作するように設計されたコンパクトな大規模言語モデル（LLM）「Stable LM 3B」のリリースを発表した。ライセンスは商用利用も可能なオープンソースの「CC-By-SA 4.0」となっている。軽量・高速にもかかわらず高度な自然言語処理が可能 2023年4月20日に最初のバージョン（3Bおよび7Bパラメーター）が発表された同社のLLM「Stable LM」シリーズだが、今回のリリースは高速な実行速度を維持しながら、テキストを生成する能力が大幅に向上しているという。高品質なデータで複数回学習させた結果、30億パラメータ（業界で通常使用されるのは70億～700億パラメータ）にもかかわらず、一般的な自然言語処理ベンチマーク性能も向上しており、従来の30億パラメーター言語モデルはもちろん、70億パラメーター規
- AI
- LLM
- 人工知能
- あとで読む
- 技術
Stable Diffusionのおすすめモデルを紹介！ダウンロード方法から著作権まで徹底解説 | WEEL
- 61 users
- weel.co.jp
- テクノロジー
- 2024/02/04
Stable Diffusionのおすすめモデルを紹介！ダウンロード方法から著作権まで徹底解説 2024 2/20 「Stable Diffusion」を使うと写真のようにリアルな画像や、高画質なアニメ調の画像を作れますが、これは使用するモデルによって異なることをご存知でしたか？今回は、画像生成に大きく影響するstable diffusionのモデルに焦点を当てて、おすすめのモデル、ダウンロード方法、使用方法、さらに商用利用時の注意点について詳しくご紹介します。この記事を最後までお読みいただければ、お好みの画像を自由に作れるようになるかもしれません。ぜひ、最後までご覧ください！なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Stable Diffusionとは Stable Diffusionは、画像
- AI
- illust
- あとで読む
- 人工知能
- photo
“革命”起こした画像生成AIに暗雲　「Stable Diffusion 3 Medium」の厳しい船出 (1/4)
- 58 users
- ascii.jp
- テクノロジー
- 2024/06/24
6月12日、Stability AIの画像生成AI「Stable Diffusion 3 Medium（SD3M）」が公開されました。Stability AIは安定的な収益につながるビジネスモデルの構築に課題を抱えており、最新シリーズ「Stable Diffusion 3（SD3）」をどう位置づけるかが生命線と思われます。そこで、有料APIの使用が必須という形で性能の高い「Stable Diffusion 3 Large（SD3L）」を先行リリースしていました。SD3を「オープン化する」とX上で発言していた創業者のEmad Mostaque氏が4月にCEOを退任したことで約束は守られるのか……とも危惧されてきました。結果としてStability AIは、品質を落としたSD3Mを出すという判断をしてきました。しかし、SD3Mはライティングに高い表現力を持つ一方、意図的に落とされた品質に大きな
OpenAI、テキスト→最長1分の動画の生成AI「Sora」発表　一般公開はせず
- 58 users
- www.itmedia.co.jp
- テクノロジー
- 2024/02/16
米OpenAIは2月15日（現地時間）、テキストプロンプトから最長1分の動画を生成するAIモデル「Sora」を発表した。一部のユーザーに公開し、フィードバックに基づいて改善していく計画。 SoraのWebページ（リンクは記事末）は「Soraは、テキストの指示から現実的で想像力豊かなシーンを作成できるAIモデルだ」と謳っている。このページには多数の動画が掲載されているが、すべてSoraが生成し、修正していないものという。複数のキャラクター、特定の種類のモーションなどを含む複雑なシーンを生成できるとしている。ユーザーがプロンプトで何を要求したかだけでなく、物理的な世界で実際にどのように存在するかも理解するという。例として挙げられた動画の1つは、「スタイリッシュな女性が、暖かく輝くネオンとデジタルサイネージで満たされた東京の通りを歩いている。彼女は黒い革のジャケット、赤いロングドレス、黒いブ
- OpenAI
- AI
- 画像生成
- 生成AI
- 人工知能
- Sora
- あとで読む
- ITmedia
日本語大規模言語モデル「Japanese Stable LM Beta」シリーズをリリースしました — Stability AI Japan
- 55 users
- ja.stability.ai
- テクノロジー
- 2023/11/02
Stability AI Japan は、オープンな日本語大規模言語モデルの中で最高性能*のものを含む「Japanese Stable LM Beta (JSLM Beta)」シリーズをリリースしました。各モデルは Llama-2 をベースとしており、追加の学習を行うことで日本語の能力や日本に関する知識等を追加し、日本における用途に特化させています。特に、最大サイズの指示応答言語モデルである JSLM Beta 70B は、700億パラメータの商用利用可能な日本語言語モデルです。2023年11月現在、我々の知る限りでは最大規模のオープンな日本語特化言語モデルとなります。 *注：性能の評価方法は後述 "A cute robot wearing a kimono writes calligraphy with one single brush" — Stable Diffusion XL (
- AI
- あとで読む
- 人工知能
- 言語
- モデル
- 日本語
- 学習