bayareadのブックマーク - はてなブックマーク

画像生成AI「Midjourney」新バージョンでさらにリアルに　もう実写にしか見えない

sponsored 部屋が狭い日本家屋仕様になったピラーレスケース、自作初心者にもオススメ！ピラーレスだがコンパクト、価格もお手頃なCORSAIRのPCケース「3500X」が完成度高い！ sponsored コスト、人材、セキュリティ…… データ活用の課題を包括的に解消するHPEの取り組みなぜHPEがソフトウェアを？統合データ基盤「HPE Ezmeral」に注力する理由を率直に聞いた sponsored JN-MD-IQ1301FHDRをレビューモバイルでも映像の質にこだわりたいなら、QLEDの13.3型液晶はいかが？ sponsored JN-i27QR-C65W-HSPをレビュー USB Type-C給電＆KVM対応の27型WQHDディスプレーで約2.8万円は即ポチ損なしの最安級 sponsored MSIがセール開催中！この夏に自作PCパーツを買う人はツイているサマーセール

bayaread 2024/08/01

リンク

「1億台の常時接続」を実現せよ！ Nintendo Switchのプッシュ通知システム全面刷新の裏側 (1/3)

アマゾンウェブサービスジャパンは、2024年6月20日と21日、国内最大の年次イベントである「AWS Summit Japan」をハイブリッドで開催。150を超えるセッションが展開された。本記事では、ニンテンドーシステムズによるセッション「Nintendo Switch向けプッシュ通知システムのリプレイス事例」をレポートする。登壇したのは、同社システム開発部の林愛美氏と坂東聖博氏だ。 2017年のNintendo Switchの発売とあわせてリリースされた「プッシュ通知システム」。同社は、長期運用を見据えて、よりクラウドネイティブなシステムへのリプレイスを決定するが、大量のTCP接続を維持するための様々な課題が立ちふさがった。本セッションでは、AWS FargateやNetwork Load Balancer（NLB）といったAWSのマネージドサービスを用いた、“最大1億台”級

bayaread 2024/06/28

あとで読む

リンク

AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。そもそもChatGPTの心臓部である大規模言語モデル（LLM）は、膨大な知識を元にテキストを「生成」する仕組みだ。逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚（ハルシネーション）を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

bayaread 2024/04/06

課金してる人とそうでない人でハルシネーションや結果の要約精度が異なるんだよね。Googleみたいに使ってもダメで、いろんなサイトがひっかかるようにクエリを工夫して、いろんなページから出典を集めるとかなり良いよ

リンク

画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。画像1枚で“似た顔”　Midjourneyの新機能「Creative Reference」使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ（cref）をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

bayaread 2024/03/25

あとで読む

リンク

日本発のリアルタイム画像生成AIサービスが熱い　大手にとっては“イノベーションのジレンマ”に (1/3)

Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました！たくさんご利用いただきありがとうございます。今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら：https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

bayaread 2024/03/19

あとで読む

リンク

画像生成AIでオリジナルキャラのLoRAができたぞ〜〜〜！！！

筆者は、オリジナルキャラクターを持っている。機田ゆんという。通常、イラストレーターさんにキャラクターデザインを渡していろんな構図の機田ゆんのイラストを描いてもらっている。常々、生成AIでキャラクターデザインを反映させてイラストを生成するにはどうしたらいいのだろうかと考えていた。機田ゆんの髪型はボブに襟足の長い、くらげのような髪型をしている。 ChatGPTの画像生成AI「DALL･E」を使って言葉（テキスト）で試してみたところ、この髪型を再現して生成させることができなかった。 ChatGPTにキャラクターの画像を読み込ませて、言語化してもらって、その言葉を使ってまた生成するのをやってみても、無理らしい。言葉でキャラクターデザインを伝えるのは無理そうだ。服装も安定しない。言葉でダメなら、絵から絵を生成するのはどうだろうか？　下絵のようなものを読み込ませて、そこから生成したらキャラク

bayaread 2024/03/17

あとで読む

リンク

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」複数のUI環境のインストールや更新がワンクリックで可能に画像生成AI「Stable Diffusion」をブラウザーで使うために必要なのがUI環境。筆者が入門したときは「Stable Diffusion WebUI（AUTOMATIC1111版）」しか選択肢がなかったが、現在は「ComfyUI」「Fooocus」「Stable Diffusion WebUI Forge」など様々な種類が出ている。これらは基本的に別のアプリケーションなので、それぞれ環境設定・インストールをする必要があり、パソコンの中に複数の環境が乱立しがちだ。さらに、これらのUIで利用するモデル（Checkpoint）やVAE（高画質化ツール）、LoRA（追加学習モデル）などもUIごとに必要になる。シンボリックリ

bayaread 2024/03/13

あとで読む

リンク

「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (2/4)

まずはこの図を見てほしい。一番左の「GPT2 Phase」はGPT-2のそれぞれの処理（フェーズ）を、「Action」はそれぞれの処理でやっていること、「Tab in Spreadsheet」は対応するExcelのシート名をあらわしている。 Excelで左から右へタブを実行していくことで、この図の上から下まで、つまり入力（Input）から出力（Output）までを再現できるわけだ。それでは、一番上（Excelでは一番左）の「Input」フェーズから順に見ていくことにしよう。「Input」フェーズ「Input」フェーズは文字通りプロンプトを入力するフェーズで「Type_Prompt_Here」シートが使用される。 2列目の「Type Prompt Below Here」の下のセルに、プロンプトを一単語ずつ（カンマやスペースも1単語と換算）入力する。初期状態ではサンプルとして「Mike

bayaread 2024/03/10

あとで読む

リンク

「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)

先日本サイトで「めちゃくちゃ重いけど動くぞ！Excelで『GPT-2』を再現したスプレッドシート」というニュースを執筆したのだが、実際に触ってみたところ想像以上に素晴らしかったのでレポートする。「Spreadsheets-are-all-you-need」とは記事で紹介した「Spreadsheets are all you need」とは、Excelの標準的なスプレッドシート機能を使ってGPT2（ChatGPTの先祖）のフォワードパス（入力から出力までのプロセス）をExcelの中で完全に実装したものだ。と言ってももちろんExcel内で「ChatGPT」的な会話ができるわけではない。ChatGPTの心臓である大規模言語モデル（LLM）のごくごく基本的な機能をシミュレートできるだけだ。本シートの説明文には「開発者でない人でも本物のLLMが内部でどのように機能しているのかを、最小限の抽象

bayaread 2024/03/09

あとで読む

リンク

日本発の画像生成AIサービスがすごい　無料アップスケーラー「カクダイV1」 (1/4)

「カクダイV1」でアップスケールした画像（左）、「Midjouney v6」で作成したオリジナル画像（右）画像の描き込みを増やして高画質にする、日本発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかったカクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI 技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

bayaread 2024/02/19

リンク

画像生成AI「Stable Diffusion」使い倒すならコレ！　「ComfyUI」基本の使い方 (1/3)

前回はStable Diffusionをブラウザーで利用するためのUIとして「Stable Diffusion web UI（AUTOMATIC1111版）」、「Fooocus」と共に多く使われている「ComfyUI」のインストール方法を紹介した。とりあえず画像の生成はできたので、あらためてインターフェースを詳しく見ていこう。まずは前回の手順に従いインストールした「ComfyUI」を起動。この画面が出ていなければ「Load Default」をクリックしよう。いくつかの四角いパーツが、カラフルなケーブルのようなもので接続されているのが見える。 ComfyUIでは配置されたそれぞれのパーツを「ノード」と呼ぶ。それぞれのノードは「モデルをロードする」「プロンプトを書く」といった機能を持っている。これらをブロックのように組み合わせて利用したい機能を構築していくのが「ノードベース」と呼ばれるCo

bayaread 2024/02/17

あとで読む

リンク

控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

bayaread 2024/02/17

価値がわからない、っていう人達は時代に置いてかられる。OpenAIにとってこれは基礎研究に過ぎないわけだし。

リンク

画像生成AI「Stable Diffusion」を使い倒す！　モジュラーシンセみたいな「ComfyUI」をインストール (1/3)

Stable Diffusionを使う際、いわゆるモデル（チェックポイント）だけで画像生成することは不可能ではないがとても難しいので、多くの人がなんらかのUI（ユーザーインターフェース）を利用している。この連載でも「Stable Diffusion web UI（AUTOMATIC1111版）」と「Fooocus」を紹介してきたが、実はもうひとつポピュラーなUIがある。それが今回紹介する「ComfyUI」だ。もちろん筆者も以前からその存在は知っていたが、他のUIとは一線を画す、ノードベースと呼ばれるグニャグニャと矢印が絡まるまるでモジュラーシンセのような独特な形状に「きっとめちゃめちゃ難しいに違いない」とビビって見て見ぬふりをしていた。結論を先に書くと難しいなんてことはなく、むしろ直感的に処理の流れがわかってめちゃくちゃわかりやすかったので、今後はこちらをメインに使っていくまであるか

bayaread 2024/02/03

リンク

AWSのコスト削減は全員で楽しくやろう　DELTAが事例とノウハウを披露

2024年2月1日、AWSのコスト削減にフォーカスした勉強会「第1回　AWSコスト削減天下一武道会」が東京汐留のタイミーオフィスで開催された。クラウドコストの削減代行を手がけるDELTA CTOの丹哲郎さんが170社の実績を元に、コスト削減の「王道」と「ケモノ道」を解説。その上で、成功させるためのコツや大切にすべきことなどをわかりやすく説明した。総削減額1億6000万強！　戦闘力高いDELTAから見たコスト削減 AWSのコスト削減に振り切った今回の「AWSコスト削減天下一武道会」は、Singular Perturbationsの取締役CTOの西谷圭介氏が企画したイベント。個人の勉強会にも関わらず、イベント登録者数は結局3500人を突破したという（関連記事：AWSユーザーの今の関心はコスト削減　生成AIじゃない）。会場となった東京汐留のタイミーオフィスには、多くの参加者が詰めかけた。また

bayaread 2024/02/03

あとで読む

リンク

“世界生成AI”到来か　画像生成AIのゲームエンジン化が進む (1/5)

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか（筆者作成）画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

bayaread 2024/01/22

あとで読む

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

bayaread 2023/12/18

あとで読む

リンク

転職から半年経った亀田さんに聞いたCloudflareのすごいところ (1/4)

熱狂の卒業イベントから半年、みんな大好き元AWSの亀田治伸さんがCloudflareのエバンジェリストとして戻ってきた。久しぶりのインタビューは、転職した経緯やCloudflareのサービスや設計思想、ゼロトラストの定義、コミュニティの話まで多岐に及んだ。（インタビュアー　ASCII編集部　大谷イビサ　以下、敬称略）ラストワンマイルの課題って意外と解消されていない大谷：まずは改めてAWSからCloudflareに転職した経緯を教えてください。亀田：AWSに7年半いて、後半5年はエバンジェリストをやらせてもらいました。クラウドは世の中を大きく変え、これから必須の存在になると私は確信しています。一方で、クラウドに面白さを感じていた人たちがそれなりにシニアになり、イビサさんが先日書いていたようにある程度のイノベーションは出尽くしてきたのも事実です。こういう時代になり、AWSでも、Goog

bayaread 2023/09/14

あとで読む

リンク

アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒

bayaread 2023/09/11

あとで読む

リンク

東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開

東京大学発のスタートアップ企業であるLightblue（ライトブルー）は、公開モデルとしては国内最大規模の67億パラメーターの日本語大規模言語モデルを開発し、オープンソース・ソフトウェアとして公開した。ライセンスはApache 2.0。東京大学発のスタートアップ企業であるLightblue（ライトブルー）は、公開モデルとしては国内最大規模の67億パラメーターの日本語大規模言語モデルを開発し、オープンソース・ソフトウェアとして公開した。ライセンスはApache 2.0。この言語モデルは、米モザイクML （MosaicML）が公開した多言語大規模言語モデル「MPT-7B」を基にしたもの。グーグルが開発した多言語データセット「MC4」をアレン人工知能研究所（Allen Institute for AI）がそれぞれの言語ごとに利用可能にしたサブセットの日本語部分を使って追加学習した。 Ligh

bayaread 2023/07/26

あとで読む

リンク

さよならTwitterの青い鳥。11年使われたアイコン、デザイナーが解説

青い鳥ともお別れ？　デザイナーがアイコン制作の経緯を解説「Twitter」を運営するXのイーロン・マスク氏が7月23日、「まもなくTwitterブランドと、そして徐々に、全ての鳥たちとも別れを告げる」とTwitter上で発言。 And soon we shall bid adieu to the twitter brand and, gradually, all the birds — Elon Musk (@elonmusk) July 23, 2023 Xは、同氏がツイッター買収のために設立した企業。同氏の発言は、Twitterという名称と、象徴的な鳥のアイコンを、新しいものに置き換えていくことを示唆している。 Today we say goodbye to this great blue bird This logo was designed in 2012 by a team o