makouのブックマーク - はてなブックマーク

AIが考える“アイドル”がリアルすぎた　グーグル「Imagen 3」なぜ高品質? (1/5)

グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。 ※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いですフィルターはとても厳しく、女性を出すのは難しいただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に

makou 2024/09/16

思ってたのと違う人の記事だった。

AI

リンク

商業漫画にAIが使われるようになってきた (1/4)

ウェブ漫画サイト「まんが王国」で配信中の、画像生成AIを使った漫画『児童福祉司一貫田逸子リメイク版』がSNS（X）を中心に話題になりました。発行元はビーグリー。オリジナル版の作者らに許諾を得た上、生成AIを利用してフルカラーに作成しなおしたものと考えられます。月間女性ランキング2位に入るほど好評のようです。絶版漫画をAIで「リメイク」ビーグリーは「まんが王国」を運営しつつ、配信する新作タイトルとして、「名作リメイクプロジェクト」として、旧作タイトルの画像生成AIを使ったリメイク展開を始めています。現在のところ4作品が展開されており、『児童福祉司』もそのプロジェクトの一貫で展開されています。男性向け漫画では松山えいじさんの恋愛コメディー漫画『エイケン』のAIリメイク版を手がけています。スマートフォンやウェブトゥーンの世界では、新しい読者へのアピール方法として、生成AIを使って過去作

makou 2024/08/12

目線が合わないは同じこと思ったことある。

AI

リンク

しまむら、AIモデル「るな」起用　20歳の服飾専門学生（という設定）

sponsored 今ならサマーキャンペーン（2024年9月9日まで）で最大2万7920円もお得になる！ Zen 5版Ryzenで新機種が激増!! サイコムの9950X/9900X/9700X/9600X搭載BTO PCに刮目せよ sponsored 攻撃アクションの調整や新機能を追加して、より豪快かつポップなアクションが楽しめる！よりキュートで爽快に！『ロリポップチェーンソー RePOP』のファーストインプレションをお届け sponsored 猛暑の後にやってくる秋にはランニングを始めよう！北海道マラソンにも協賛するファーウェイの人気スマートウォッチ「HUAWEI WATCH GT 4」で運動の秋に備える！ sponsored Fractal Design「Pop XL Silet Black Solid」を採用実は最近だとレア？吸音材採用ケースで静音に特化したゲーミングPCのコ

makou 2024/05/22

利用者の体型とか肌色とか髪の長さとか化粧具合なんかのモデルを一人でまかなえるなら都合がいいかもしれない。ただ、そういう都合であるなら余計なプロフィールは要らない。

AI

リンク

アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮複数（30億、70億、300億）のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2（画像理解）、TextVQA（画像内のテキスト情報）、ScienceQA（科学知識）、MMBench（マルチモーダル）、MathVista（数学）などの

makou 2024/03/19

AI

リンク

「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)

先日本サイトで「めちゃくちゃ重いけど動くぞ！Excelで『GPT-2』を再現したスプレッドシート」というニュースを執筆したのだが、実際に触ってみたところ想像以上に素晴らしかったのでレポートする。「Spreadsheets-are-all-you-need」とは記事で紹介した「Spreadsheets are all you need」とは、Excelの標準的なスプレッドシート機能を使ってGPT2（ChatGPTの先祖）のフォワードパス（入力から出力までのプロセス）をExcelの中で完全に実装したものだ。と言ってももちろんExcel内で「ChatGPT」的な会話ができるわけではない。ChatGPTの心臓である大規模言語モデル（LLM）のごくごく基本的な機能をシミュレートできるだけだ。本シートの説明文には「開発者でない人でも本物のLLMが内部でどのように機能しているのかを、最小限の抽象

makou 2024/03/09

面白い。

AI
msoffice

リンク

昔はまったく売れなかった「電気の要らない自動ドア」が人気を集めているらしい

Newtonプラスが、3月2日、日本トーターグリーンドーム前橋で開催中の「UPDATE EARTH 2024 ミライMATSURI@前橋」で「電気を使わない自動ドア」を展示した。電気で開閉するから自動ドアなのに、電気を使わないとはどういうことか？　聞けば、床板に荷重がかかるとドアが開く構造を持った、機械式の自動ドアだという。電気によるランニングコストが発生しないことに加え、災害時や停電時でも開かなくなることがない安全性、人が乗っている限りは閉まることがないので、挟まれる心配もないなど、メリットは複数ある。建物の構造的に建築基準法をクリアできない場合を除き、既存の自動ドアを置き換える形で設置することも可能。主に自治体や、ビル内の授乳室、災害時の避難所の役割を果たしている地域の店舗やビルといった、公共性の高い場所への導入が進んでいるという。この製品、実は14年前に発売されているが、ほと

makou 2024/03/03

手動ドアって呼称にならんの？

architecture

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

makou 2024/02/26

AI

リンク

「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。ノイズ除去をバッチ処理で高速化「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス（CFG）に代わり、残差分類器フリーガイダンス（RCFG

makou 2023/12/22

github見てるだけで面白い。/ https://github.com/cumulo-autumn/StreamDiffusion/tree/main/demo/realtime-txt2img のことを言いたいのかなとも思ったが…。

AI

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

makou 2023/12/19

AI

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

makou 2023/10/16

AI

リンク

伊藤園「おーいお茶」CMに生成したAIタレントを起用

伊藤園が「お～いお茶カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、本物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日本初になるという。同社は発表に際して「AI 技術で生成したAI model（AIモデル）を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。「お～いお茶カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

makou 2023/10/14

表情変わるときに骨格変わってね？って、実は人間でしたーってオチだと軽くショックだ。

AI

リンク

商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)

AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AI「Emi（Ethereal master of illustration）」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。「Stable Diffusion XL（SDXL）」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。モデルをダウンロードして指定フォルダーに入れるだけまずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待と

makou 2023/09/30

AI

リンク

ドコモ回線、品質低下の一因は“通信技術”か (1/3)

先週末に東京ビッグサイトで開催された「コミケ」。個人的には「各キャリアのネットワーク品質は大丈夫かな」という心配をしながら、SNSをチェックしていた。案の定、NTTドコモのネットワーク品質がすこぶる不評なのがわかった。ダウンロード速度をチェックするアプリのキャプチャ画面が何枚も上がっており、NTTドコモのネットワークは「10年前の速度かと思った」と揶揄されているほどであった。ただ、昔と違ってネットで簡単にサブ回線を調達できるということもあり、楽天モバイルやpovoの回線で、しのいだ人も多いようだ。 NTTドコモのネットワーク品質に関しては、今年に入って「ターミナル駅周辺で遅い」と指摘されていた。同社では4月に「この夏までに対策する」と発表。先日、基地局にあるアンテナの角度や出力、指向性などの調整などをして、都内の新宿、渋谷、池袋、新橋において、概ね、ネットワーク品質が改善しているとの発

makou 2023/08/16

network

リンク

ChatGPT新機能が“無双”だった（西田宗千佳） (1/4)

新連載を始める。テーマはAIのニュースチェックだ。基本的には2週に一度、主にASCII.jpで公開されるニュースについて、簡単な解説と流れの分析をしていきたい。紹介されていないものでも重要な話については、別途短い解説を追記していく。というわけで1回目は、2023年7月前半のAIニュース振り返りだ。（※記事のタイトルをタップすると記事ページが開きます） DeepL、日本法人「DeepL Japan 合同会社」を設立日本企業との取引を迅速化（7月3日）翻訳AIは急速に品質が上がり、日常的に筆者もお世話になっている。DeepLは利用者を増やしているが、実のところ、無料版が強いというよりも「個人事業主でも、企業でも気軽に契約できる有料版」があることがビジネスの強みだ。日本の場合、翻訳AIを使うといってもそれは「無料でGoogle翻訳を使う」ことが多く、有料版利用は企業でも多くはないという。

makou 2023/07/20

AI

リンク

「撮影罪」はじまる、同意のない撮影は禁止　飛行機内の撮影にも注意を (1/2)

本日7月13日から「撮影罪」が施行される。これにより性的姿勢等のひそかな撮影（盗撮）、それらを第三者に提供する行為、インターネットや動画配信などで公開する行為、保管する行為がすべて処罰対象となり、盗撮に対して最大3年の拘禁または最高300万円の罰金が、不特定多数への提供行為に対してはさらに重い最大5年の拘禁、または最高500万円の罰金が科されることとなる。法律改正のきっかけとなった事例のひとつに、飛行機内での客室乗務員の盗撮行為がある。高速で飛行する航空機の特性が都道府県ごとの法制度の抜け穴を生み、特定できない場所での盗撮行為を処罰できず、客室添乗員の盗撮が法の抜け穴となってしまうといった実態があった。 ANAは「撮影罪」についてのポスターを羽田空港に掲示し、空港の利用客に向けて撮影罪の法制化、無断撮影禁止についての周知を始めている。「撮影罪」とは何か？「撮影罪」は正式名称を「性的な

makou 2023/07/13

成長した子供が、インスタに幼少時の写真をアップした親を訴えるとか（※遡れない）。

law
privacy

リンク

ゲームの“自動生成”技術がすごいことになっている (1/4)

いま生成AIが話題になっていますが、AI 技術の一つである「プロシージャル生成」の考えも重要です。プロシージャルというのは数式や関数にもとづき3Dコンテンツを生成する手法で、「手続き型」とも言われます。自動的にデータを作り出すという側面から、生成AIとプロシージャル生成は混同されることがありますが、実はまったく違う背景を持つ技術です。Epic Gamesが新たにゲームエンジン「Unreal Engine 5.2」に搭載したプロシージャルコンテンツ生成機能（PCG）は驚くべきものでした。3月のGDCで発表されていたデモマップ「Electric Dream」が6月21日に公開されています。今回はこのデモマップを使って技術を紹介しながら、生成AIとの違いを見ていきます。お待たせしました！ Electric Dreams 環境サンプルプロジェクトを無料公開しました！#UnrealEngine 5

makou 2023/07/10

AI
game

リンク

画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

makou 2023/05/23

AI

リンク

アップルM2チップ生産中断か　売れ行き不振で

アップルは新型MacBook Air／Proに搭載しているM2チップの生産を2023年初めに全面中断していたという。韓国メディアThe Elecが4月3日に報じた。同紙は業界筋からの話として、台湾のTSMC社が1月と2月にM2チップ用にウェーハ加工した半導体をパッケージ工場に送っていないと伝えている。原因はアップルがMacBookの需要減少を予測し、生産中断を要請したためだとみられている。同紙によると3月からはまた動き出したそうだが、例年の半分程度の水準にとどまっているとのことだ。 M2チップ搭載MacBookが売れていない理由だが、おそらくは多くの人がM1チップ搭載MacBookで満足してしまっているものと思われる。筆者もそのひとりだ。単純に毎年買い替えるお金がないだけとも言えるが……。

makou 2023/04/12

apple

リンク

「AIトレパク」が問題に (1/3)

3DアバターのVRMのスクショアプリ「VRM Posing Desktop」を使いVRMで画像（左）を作成後、Stable DiffusionのWebUIでimg2imgを行ってイラスト風の画像（右）を生成したもの。（画像：筆者作成）画像生成AIの「img2img」が議論を起こしています。 img2imgとは、画像生成AIの機能の1つ「Image-to-Image」の略称。画像を読み込ませて、テキストで指定するプロンプトと合わせて画像生成すると、元となる画像のイメージを踏襲した画像を作ってくれるという機能です。たとえば3DアバターのVRMデータを読み込ませるだけでアニメ風の絵が生成されます。パラメーターの設定次第ですが、元のキャラクターの特徴もそのまま踏襲させることが可能です。元となる画像を用意することで、同じ顔つきのやポーズの画像が生成を容易にすることができるわけですね。この原理を

makou 2023/01/25

AI
copyright

リンク

グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表

グーグルは1月2日、従来のモデルよりも大幅に効率的でありながら、最先端の画像生成性能をもつテキスト画像AI生成モデル「Muse」を発表した。競合モデルと同クオリティかつ超高速化近年「Stable Diffusion」やOpenAIの「DALL-E 2」など、テキストから画像を生成するAIは驚くべき進化を見せている。グーグルもすでに「Imagen」と「Parti」という画像生成AIを発表しているが、「Muse」はそのどれとも異なる新しいモデルだ。

makou 2023/01/06

AI

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (200)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス