タグ

ブックマーク / ascii.jp (80)

  • 画像生成AI「Stable Diffusion 3 Medium」公開 プロンプトの理解力が上がり、リアルな画像が生成可能に

    画像生成AI「Stable Diffusion 3 Medium」公開 プロンプトの理解力が上がり、リアルな画像が生成可能に Stability.aiは6月12日、同社が開発する画像生成AI「Stable Diffusion 3」シリーズの最新モデル「Stable Diffusion 3 Medium」を発表、重み付きモデルをHugging Faceで公開した。無償の非商用ライセンスおよびクリエイターライセンスの下で利用可能だ。 3種類のテキストエンコーダーで複雑なプロンプトに追従 Stable Diffusion 3 シリーズの最新かつ最も洗練されたモデルである Stable Diffusion 3 Medium をご紹介します。 このリリースは、生成 AI の進化における大きなマイルストーンであり、オープンな生成AIに対する私たちの取り組みを継続するものです。 詳細は、こちらをご覧くだ

    画像生成AI「Stable Diffusion 3 Medium」公開 プロンプトの理解力が上がり、リアルな画像が生成可能に
    tomoP
    tomoP 2024/06/14
  • めちゃ便利になった 無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)

    OpenAIは5月30日、同社のチャット型AIChatGPT」無料版ユーザーに向け、制限付きながら最新の大規模言語モデル「GPT-4o」および、これまで有料版ユーザーしか利用できなかった多くの機能を公開した(発表時のニュース記事)。 情報がとても多いので、今回の変更で無料版ユーザーは「なにができるようになったか」、そして「なにができないのか」を使い方中心にまとめた。 1. GPT-4oは回数制限あり チャット型AIアプリの心臓とも言える大規模言語モデル(LLM)、これまで無料版ユーザーは「GPT-3.5」という旧世代モデルしか利用できなかったが、今回の変更で回数制限(具体的な回数は明記されていない)はあるものの、最新モデルのGPT-4oが使えるようになった。 GPT-4oの利用に特に設定などは必要なく、無料アカウントにログインして普通に質問すればOK(使い方はちょっとわかりにくいのでこち

    めちゃ便利になった 無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)
    tomoP
    tomoP 2024/06/08
  • 実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)

    こんにちは、漫画界の生き恥こと野火城と申します。 「画像AI使ってみた/AI漫画実験企画」第2回です! ■第1回はこちら 実録:AIで描く漫画の実際 ~体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。 だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。 「画像AI技術がすごいという賞賛記事はよく見るが、それは当に創作活動で実戦的に使えるものなのか? 『AI仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは? 実際はどっちなんだ?」「画像AIを試し

    実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)
    tomoP
    tomoP 2024/05/30
  • アスキーゲーム:『まいごのあるる(PC-9801版)』と『ワンダーランド OF CARBUNCLE(MSX2版)』がプロジェクトEGGでリリース!

    D4エンタープライズは5月28日、同社が運営するレトロゲーム配信サービス「プロジェクトEGG」にて、コンパイルが1992年にリリースした『まいごのあるる(PC-9801版)』と、1991年にリリースした『ワンダーランド OF CARBUNCLE(MSX2版)』を同時配信した。 価格は『まいごのあるる(PC-9801版)』が990円、『ワンダーランド OF CARBUNCLE(MSX2版)』が880円だ。

    アスキーゲーム:『まいごのあるる(PC-9801版)』と『ワンダーランド OF CARBUNCLE(MSX2版)』がプロジェクトEGGでリリース!
    tomoP
    tomoP 2024/05/29
  • しまむら、AIモデル「るな」起用 20歳の服飾専門学生(という設定)

    sponsored 軽量薄型で、かつ安価! 15.6型実用ノートがセールでさらに安い! sponsored 夏ボーナスと夏休みを先取り! Ryzen 7+4060 Tiでちょうどいい性能のゲーミングPCをセールで手に入れよう! sponsored X-360Q(JN-27IPS360WQHDR-HSP)をレビュー 360Hz・WQHDの27型ゲーミングディスプレーが9万円台! KVMも90W給電も使えてお得感大 sponsored 「JAPANNEXT 上総中川駅」誕生の経緯をいすみ鉄道の社長にインタビュー ディスプレー会社が駅名に!? JAPANNEXT×いすみ鉄道の異色コラボはなぜ実現したのか sponsored Radiant GZ3500Z790/D5をカスタム BTOってマジ大事。16万円台のふつ~なPCが20万円のi5&RTX 4060のゲーミングPCに sponsored 音

    しまむら、AIモデル「るな」起用 20歳の服飾専門学生(という設定)
    tomoP
    tomoP 2024/05/21
  • グーグルのAI「Gemini○○」いっぱいありすぎてワケ分からん問題に分かりやすく答える

    Google I/Oで発表された「Gemini○○」 いっぱいありすぎてワケ分からん問題 5月14日(現地時間)にグーグルが開催した開発者向けカンファレンス「Google I/O 2024」では、同社のAIであるGeminiに関連する技術が山程発表されました。正直、ここで発表された「Gemini○○」と名付けられたサービスや技術が多過ぎて、一般の人にはなんだかよく分からんという状態になってしまっていたような気がします。 まあ、元から技術者向けのカンファレンスなので一般の人がどうしても理解しなければいけない内容でもないのですけど、たとえ一般人であっても、あのグーグルが何を考え、次に何をしようとしているのか知っておきたい、と思っても不思議はないでしょう。そこで稿では、「Google I/O 2024」で発表された内容を、私と同じくらいの一般の方に向けてキーワードごとにちょっとずつ解説してみよ

    グーグルのAI「Gemini○○」いっぱいありすぎてワケ分からん問題に分かりやすく答える
    tomoP
    tomoP 2024/05/21
  • グーグル、2TBのストレージと最新AIが使えて月2900円の「AIプレミアム」

    グーグルは5月14日(現地時間)、有料プラン「Google One AIプレミアム」(月額2900円)のユーザー向けに、最新の大規模言語モデル(LLM)「Gemini 1.5 Pro」を導入すると発表した。 Google One AIプレミアムはGoogleフォト、Googleドライブ、Gmail共通で使える2TBのクラウドストレージに、同社の有料版LLMを追加したプラン。同プランではこれまで「Gemini 1.0 Ultra」を利用できたが、今回新たにGemini 1.5 Proを選択できるようになった。 Gemini 1.5 Proは英語や日語など複数の言語に対応。ブラウザーもしくはiOS版「Google」アプリ、Android版「Gemini」アプリからアクセスし、文書やメール文案の作成、コーディングからアップロードした文書の分析まで、さまざまな作業をAIに依頼することが可能だ。

    グーグル、2TBのストレージと最新AIが使えて月2900円の「AIプレミアム」
    tomoP
    tomoP 2024/05/16
  • グーグル、新しい画像生成AI「Imagen 3」発表 かなりキレイで文字入れもOK

    グーグル傘下のDeepMindは5月14日(現地時間)、同社が開発する画像生成AI「Imagen」の最新バージョン「Imagen 3」を発表した。画像の詳細さが増し、テキストのレンダリング能力が強化されたほか、悪用防止のための“電子透かし”にも対応している。 プロンプトの理解力が向上 Imagen 3はテキストプロンプトから高品質な画像を生成する画像生成モデルの最新版。以前のモデルと比べて、画像の詳細さが増し、乱れも少なくなっているという。 プロンプト文の理解力も大幅に向上しており、長く複雑なプロンプトから細部まで忠実に再現された画像を生成できるのが売りだ。 プロンプト:A large, colorful bouquet of flowers in an old blue glass vase on the table. In front is one beautiful peony fl

    グーグル、新しい画像生成AI「Imagen 3」発表 かなりキレイで文字入れもOK
    tomoP
    tomoP 2024/05/16
  • グーグル、AIモデル「Gemini」大型更新 前代未聞の200万トークン入力可能に

    グーグルは5月14日(現地時間)、開発者向けカンファレンス「Google I/O 2024」を開催。同社が開発する大規模言語モデル(LLM)「Gemini」ファミリー全体に大規模なアップデートを導入したことを発表した。 広がるGeminiファミリー グーグル2023年12月、同社初のマルチモーダルLLM「Gemini 1.0」を、「Ultra」「Pro」「Nano」の3種類のサイズで公開、2024年2月には100万トークンのコンテキストウィンドウを備えた「1.5 Pro」を公開してきた。 「Google I/O 2024」では新たに最軽量モデルの「1.5 Flash」を発表、あわせて大幅に改良された「1.5 Pro」、オープンモデル「Gemma」のアップデートなども発表された。 スピードと効率を最適化した「1.5 Flash」 1.5 Flashは、今回新たに発表されたGeminiファミ

    グーグル、AIモデル「Gemini」大型更新 前代未聞の200万トークン入力可能に
    tomoP
    tomoP 2024/05/16
  • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

    画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

    画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
    tomoP
    tomoP 2024/05/09
  • 動画生成AI、映像制作の“民主化”目指して研究進む (1/4)

    動画生成AIの研究「Open Sora」から派生した「MagicTime」の技術で生成した桜の開花の動画の一部(筆者作成) 2024年1月にOpenAIが発表した動画生成AI「Sora」はインパクトがありましたが、DeepMindが開発したフレームごとの動画をブロック状にデータとして出す方式「時空間パッチ(Space-Time Patch)」という方式を使ったのではないかと推測されていました(「動画生成AIの常識を破壊した OpenAI「Sora」の衝撃」参照)。発表された技術レポートの情報を合わせて、推測する方式をまねれば、同様のことができるのではないかということで、新しい動画生成AIの研究が進んでいます。 OpenAI「Sora」まねた研究が続々 その代表例が、3月リリースされた「Open Sora」というプロジェクト。中心として進めているのは、中国系のAIスタートアップのHPC-AI

    動画生成AI、映像制作の“民主化”目指して研究進む (1/4)
    tomoP
    tomoP 2024/05/07
  • XPGから美少女キャラがデザインされたDDR5メモリーが登場

    XPG「XPG LANCER RGB DDR5 RO姫バージョン」、「XPG LANCER RGB DDR5 吹雪バージョン」

    XPGから美少女キャラがデザインされたDDR5メモリーが登場
    tomoP
    tomoP 2024/05/05
  • Stable Diffusionの生成速度をビデオカード複数枚挿しで“実質的に”爆速にしてみた (1/3)

    Stable Diffusionを代表とする画像生成AIにおいて、生成スピードを上げるにはより強力なGPUが必要だ。GeForceならRTX 4090のような最強のGPUが使えればいいが、誰もが手にできる価格とは言い難い。 となればビデオカードを複数枚使用してStable Diffusionの生成スピードが向上しないだろうか? と考えるのは自然な流れだが、今のStable Diffusionは複数のGPUを協調させて処理する機能は搭載されていない。 しかし、Stable Diffusion(とAutomatic 1111)をGPUごとに紐付けて起動することで、ビデオカードの数だけ並行して作業を進めることができる。玄人志向の製品紹介ページには、まさにそういった記述が存在する。 玄人志向公式サイトの製品紹介ページには、複数のビデオカードを使うとStable Diffusionの生成速度がほぼ倍

    Stable Diffusionの生成速度をビデオカード複数枚挿しで“実質的に”爆速にしてみた (1/3)
    tomoP
    tomoP 2024/05/03
  • 帰ってきてくれた(涙)!! ガリガリ君「チョコミント」が久しぶりの復活、もう離したくない

    赤城乳業は「ガリガリ君リッチチョコミント」(100ml、173円)を5月7日より発売します。 ガリガリ君の「チョコミント」従来よりミルクが濃く ミントアイスの中に、チョコチップ入りのミントかき氷を入れたアイスキャンディー。従来品はラクトアイス規格でしたが、今回、乳成分を多く配合し、アイスミルク規格にリニューアル。ミルクのおいしさ、チョコチップの感、ミントの清涼感、氷の爽やかさを楽しめるとうたいます。 また、アイスのスティックは「ガリガリ君川柳!チョコミント編」と題し、通常の無地スティックの他に、「チョコミント」の6文字にちなんだ5・7・5の川柳とガリガリ君をデザインした6種類のオリジナルスティックがランダムで登場します。数量限定のためレアなんだとか。 昨年は見かけなかった……!? ガリガリ君のチョコミントフレーバーは2018年に初登場し、2022年までは毎年登場していたのですが……。20

    帰ってきてくれた(涙)!! ガリガリ君「チョコミント」が久しぶりの復活、もう離したくない
    tomoP
    tomoP 2024/05/03
  • マイクロソフト最新SLM「Phi-3」 メタ「Llama 3」あっさり抜く

    マイクロソフトは4月23日、生成AI向けの小規模言語モデル(SLM)「Phi-3-mini」を発表した。 Phi-3-miniは、パラメーター数が38億の比較的小型軽量な言語モデル。単純なタスクに適しており、特定のニーズに合わせて容易に微調整できる点を特徴とする。スマートフォンや自動車のコンピューター、リモートカメラといったリソースの少ないデバイスでも利用できるほか、オフライン動作にも対応し、ネット接続が困難な地域でも生成AIの恩恵を受けられるという。 同社が実施したベンチマークテストでは、パラメーター数で勝るメタの「Llama 3-8B-in」(80億)や、グーグルの「Gemma 7B」(70億)に対して、より優れた性能を発揮。特にLlama 3に関しては、4月18日のリリースからわずか5日でPhi-3-miniに追い越される形となった。 ただしPhi-3-miniも万能ではなく、広範な

    マイクロソフト最新SLM「Phi-3」 メタ「Llama 3」あっさり抜く
    tomoP
    tomoP 2024/04/25
  • データセンター建設ラッシュ 日本への投資が熱を帯びる3つの要因

    データセンター市場が活況だ。 2024年4月18日には、米国のソフトウエア大手オラクルが、日での事業に今後10年間で80億米ドル超(1兆2000万円超)を投資すると発表した。10日には米マイクロソフトが29億ドル(約4400億円)を投資すると発表している。 日政府の動きも目立つ。経済産業省は19日、AIの開発に必要なデータセンターの建設や増強を目指す日国内の5社に対して、最大725億円を補助すると発表している。 こうした流れを受けて、データセンターの建設を手がける企業や、ネットワークに関する専門性の高い企業、データセンター周辺のセキュリティを手がける企業への引き合いも増えているようだ。日でデータセンターの建設ラッシュが生じている背景には、複数の要因がありそうだ。 生成AIの進展 第一に上げられるのは、やはり生成AIの進展によるデータセンター需要の高まりだ。 たとえばAIがチャットの

    データセンター建設ラッシュ 日本への投資が熱を帯びる3つの要因
    tomoP
    tomoP 2024/04/23
  • 【でかっ】コメダの「鶏タツタ」がマクドナルドの倍くらいあるんだが……

    コメダ珈琲店は「鶏タツタバーガー」を4月17日に販売開始しました。バンズからはみ出るほどの大判サイズの鶏むね肉を使用したバーガーメニュー。 「鶏タツタバーガー」がコメダ珈琲店から登場するのは初めてです。 ■コメダ珈琲店 「鶏タツタバーガー」 720円~790円(店舗によって異なる) 「鶏タツタバーガー」はリリースにも「ボリューム感にこだわり開発した」と記載されており、注目はなんといっても大きさ。コメダ珈琲店というと「ポスターの写真より実物のほうが大きい」という、ポジティブな意味で“逆詐欺”の呼び声があるほど、メニューのボリューム感には定評があります。

    【でかっ】コメダの「鶏タツタ」がマクドナルドの倍くらいあるんだが……
    tomoP
    tomoP 2024/04/22
  • パワーアップする「メモ帳」Copilotに対応、「ワードパッド」は終息

    進化する「メモ帳」、変わるテキスト編集ソフトの未来 2023年9月、マイクロソフトは「ワードパッド」を非推奨とし、2024年3月27日、とうとうWindows 11 24H2に搭載しないと発表した。「ワードパッド」はWindows 95から搭載された簡易ワープロソフトで、約30年間もWindowsに標準搭載されてきた。昔は、「メモ帳」で扱えるファイルサイズに制限があり、大きなファイルを開くときなどに活躍していた。しかし、今ではそんな制限もなくなっており、筆者としても「ワードパッド」を起動することはほぼないので、標準アプリからの削除も致し方のないところ。お疲れさまでした。 「ワードパッド」がバージョンアップされない中、「メモ帳」は着実に進化を続けている。もう何年も「メモ帳」を使っていない、と言う人は驚くこと請け合い。 なんとタブ機能を搭載し、複数のメモを切り替えながら作業できるのだ。「+」ボ

    パワーアップする「メモ帳」Copilotに対応、「ワードパッド」は終息
    tomoP
    tomoP 2024/04/10
  • GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

    カナダのAIスタートアップCohereは4月4日(現地時間)、ビジネス向けに最適化された最新の大規模言語モデル(LLM)「Command R+」を発表した。 高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransformerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K(12万

    GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」
    tomoP
    tomoP 2024/04/09
  • 音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)

    著作権侵害を未然に防ぐ機能も持つ 昨年紹介した音楽生成AI「Stable Audio」が「Stable Audio 2.0」となり大きく進化した。 生成AIがブレイクするきっかけを作った画像生成AI「Stable Diffusion」を開発したStability AIによる音楽生成AIだ。2023年8月にバージョン 1.0をリリースした際にはこの連載でも紹介した。グーグルの「MusicLM」のようにプロンプトを与えることで、音楽を作り出す音楽生成AIで、Stable Diffusionのようにステップを経て徐々に生成が完了する“拡散モデル”を使用しているのが特徴だ。Stable Audio 2.0では、モデルが新しくなったのが最大の改良点だ。ある入力に対応して生成される出力に関して、生成のルールやパターンを決めるのがモデルである。つまり、知識やアルゴリズムを持つ中核部分が改良されたことにな

    音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)
    tomoP
    tomoP 2024/04/08