Stable Diffusionの最新モデル「SDXL 1.0」と過去モデルの生成画像をひたすら比較して進化を実感してみたPythonPython3StableDiffusion Supershipの名畑です。週刊少年ジャンプ34号に掲載された小園江ナツキ先生の読切漫画「殺陣ロール」好きです。 はじめに 7月27日についにStable Diffusionの新モデルSDXLの1.0がリリースされました。当初の予定よりは遅れたものの、0.9がリリースされた6月23日から1月程度での高速リリースです。 SDXL 0.9の際に「Stable Diffusionの最新モデルSDXL 0.9と過去モデルで生成画像を比較してみた」という記事でStable Diffusionにおける生成画像の変遷をまとめましたが、今回もSDXL 1.0でどのように変わったのかを記録に残します。 画像の生成はPythonで
Jacob Zinkula [原文] (翻訳:大場真由子、編集:井上俊彦) Jul. 31, 2023, 09:00 AM テックニュース 15,585 生成AI技術の台頭は、多くの労働者にとって生産性を高めてくれる可能性がある。 だが、OpenAIのサム・アルトマンCEOは、一部の仕事は「間違いなく失われる」と話している。 その代わりに新たな雇用が生み出されるかもしれないが、職を失った人全員が恩恵を受けられるわけではない。 ChatGPTのような生成AIのテクノロジーは、今後多くの労働者の生産性を高めてくれる可能性があるが、そのプロセスの中で職を失ってしまうアメリカ人もいるだろう。 そう語るのは、ChatGPTを開発したOpenAIのサム・アルトマン(Sam Altman)CEOだ。アルトマンは、AIの発展が人々の生活の質に「途方もない飛躍」をもたらす可能性があると話している。その一方、
7月28日、APIインフラストラクチャは使命上重要であることを強調する発表を行いました。 APIはあらゆる産業を革新し、デジタルトランスフォーメーションを推進し、グローバルなインターネットトラフィックの83%以上を占めています。 しかし、APIはセキュリティ上の課題を抱えており、サイバー攻撃の標的になっています。 この記事では、API関連のセキュリティインシデントの増加とコストの上昇、およびAPIが使命上重要なインフラストラクチャである理由について説明します。 詳細は以下の通りです。 7月27日、API管理とマイクロサービスAPIゲートウェイを提供する企業Kong(コング)が、APIのインフラストラクチャがますますミッションクリティカルであると指摘する発表を行いました。APIは世界のあらゆる産業に革命をもたらし、デジタルトランスフォーメーションを推進する上で不可欠な要素であり、全世界のイン
コードがはっきりときれいに見えるように、プログラミング向けに読みやすさを追求したフォント「Commit Mono」を紹介します。 似た字形(「tl1I|!ij」「O0QDØ38B」「:;.,''''"」「2Z5S7T6b」)ははっきりと区別できるようにデザインされており、また等幅フォントでよくある特定の文字間で幅が等しく見えない問題(「mm」「oの左右」など)も改善されています。 Commit Mono. Neutral programing typeface Commit Monoは、デンマーク出身のクリエイティブデベロッパー兼デザイナーであるEigil Nikolajsen氏によるプロジェクトで、プログラミング向けに読みやすさを追求して作成されたフォントです。 ライセンスはSIL OPEN FONT LICENSE Version 1.1で、商用利用は無料、Webフォントに変換したり改
この記事は新野淳一氏のブログ「Publickey」に掲載された「AWS、IPv4アドレスの使用に課金、1時間当たり0.005ドル。2024年2月1日から」(2023年7月31日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。 米Amazon Web Services(AWS)は、サービスを外部に公開するためのパブリックなIPv4アドレスを使用する場合に、1時間あたり0.005ドルの課金を2024年2月1日から開始することを発表しました。 1時間当たり0.005ドルは1日当たりに換算すると0.12ドル、1カ月を30日とすると1カ月当たり3.6ドル。1ドル140円換算で1カ月当たり504円となります。 希少資源となるIPv4アドレス インターネットで広く使われているIPv4アドレスは数に限りがあり、12年以上前の2011年2月には管理団体からの配布が終了しています。 参
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Google Researchと米Google DeepMindに所属する研究者らが発表した論文「Android in the Wild: A Large-Scale Dataset for Android Device Control」は、Androidデバイスを自然言語で操作するための大規模な学習データセットを提案した研究報告である。このデータセットには、画面やアクションを含むデバイスのインタラクションの人間によるデモンストレーションと、それに対応する自然言語の指示が含まれている。データセットはこちらから入手できる。 自然言語コマンド
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。 このLlama 2、GPT-3.5の3月1日時点のモデルに匹敵する性能を持っているというのがウリです。GPT-3.5といえば、無料版のChatGPTで使われているモデルです。それがオープンソースとして公開されたのですから、衝撃的です。 さらに、高性能なだけでなくモデルサイズが小さいことも特徴です。GPT-3のパラメータ数は1750億(175B)、GPT-3.5は未公開ではあるものの3550億(355B)と推定されています。一方で、Llama 2は、700億(70B)パラメータで、GPT-3.5並をうたっています。 パラメータが小さくなれば必要なGPUのメモリも小さくなります。GPT-3.5はデー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く