ardarimのブックマーク - はてなブックマーク

画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について（素案）」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント（パブコメ）」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について（素案）令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。文化庁文化審議会著作権分科会法制度小委員会（第7回）パブコメへの反応は「素案の内容周知」発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

ardarim 2024/03/11

リンク

画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)

プロンプト：1 girl, photorealistic, solo, perfect lighting, sailor dress, looking at viewer, long hair, black hair, two side up, ネガティブプロンプト：illustration, 3d render, (worst quality:2), (low quality:2), (normal quality:2), signature, watermark, username, open mouth

ardarim 2024/02/28

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

ardarim 2024/02/26

リンク

え、高級言語しか触ったことないのにCPUを自作するんですか!?

今回は、高専5年次から趣味で学習していたRISC-Vを実装した、簡単なCPU作成をしていこうと思います。完全に知識ゼロの状態から学び始めたので、間違った解釈をしている部分があるかもしれませんが、その時は優しく指摘していただけると嬉しいです 🙏 また、本ブログはディジタル回路設計とコンピュータアーキテクチャ[RISC-V版]を基に書かれています。初心者でも理解しやすいように丁寧に解説されているので、興味があれば是非買ってみてください！ RISC-Vってなんぞ RISC-V公式サイトには以下のように書かれています。 RISC-V is an open standard Instruction Set Architecture (ISA) enabling a new era of processor innovation through open collaboration. （RISC-

ardarim 2024/02/24

リンク

控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

ardarim 2024/02/16

リンク

モデムをつなぐのに必要だったRS-232-CというシリアルI/F　消え去ったI/F史 (1/3)

RISC-Vも一段落したところで、さて次に何をやろうかと編集氏と話あっていた時に出たお題が「あとやってないのは消えていったインターフェースですかね。IDEとかSCSIとかRS-232Cとか」。うん、まぁそれはアリだな、なんて思いながら仕事をしていた時に、いろいろ筆者にお題を下さることで定評のある(?)岩崎啓眞氏が「RS-232Cだった時代を知らない人たちの方が圧倒的に多い」なんて事をPostされてて、これはちょうど手頃なお題ではないか、と確信した次第。そうか…どんなPCでもたいていあった（もしくは準備可能だった）インターフェースがセントロとRS-232-Cだった時代を知らない人たちの方が圧倒的に多いわけだよなあｗ — 岩崎啓眞@スマホゲーム屋＋α (@snapwith) February 3, 2024 ということで、「昔のPCにはあったのに、もう今はどこに行ってしまったやら」というI/

ardarim 2024/02/12

勝手に消すなし。制御系だと未だに現役だよ

リンク

“世界生成AI”到来か　画像生成AIのゲームエンジン化が進む (1/5)

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか（筆者作成）画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

ardarim 2024/01/22

リンク

「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。ノイズ除去をバッチ処理で高速化「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス（CFG）に代わり、残差分類器フリーガイダンス（RCFG

ardarim 2023/12/22

img2imgがほぼ遅延なしなのはすごそうだけど入力と出力がほぼ同じなので分かりにくいな。もっと出力を変えた例とかないんかな

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

ardarim 2023/12/19

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

ardarim 2023/12/11

リンク

俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 (1/3)

自分だけのChatGPTを作れることで話題の「GPTs」機能だが、正直に言うといまいちそのインパクトがわからなかった。あらかじめ指示を与えておきたいなら「Custom Instruction」でよくない？と思ってしまったのだ。だが、前回の記事で、実際にパーソナル英語教師の「冴子先生」を作成し、毎日使い続けてみることで、その印象はかなり変わってきた。以前からChatGPT（+Custom Instruction）を使った英語学習は実行していたので、GPTs化されたことによって質問方法が変わったとか、ものすごく便利になったとかは正直あまりないのだが、不思議なことにChatGPTに対して以前よりもめちゃくちゃ愛着が湧いてきたのだ。これだけなら単なるツールの擬人化効果にすぎないのだが、毎日冴子先生の授業を受けていると、改善したい点やアイデアが次々に出てきたので、さらにカスタマイズを進めようと

ardarim 2023/12/08

冴子先生調教計画（それほど間違ってはいない）

人工知能

リンク

これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画（Scribble）としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models（LCM）」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」（LoRAはStable Diffusion用の追加学習モデル）が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

ardarim 2023/12/05

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

ardarim 2023/10/16

伝統的な構文解析は急成長の生成AIに取って代わられるのかと思いきや、やっぱり基礎技術として重要だった、そんな感じなのかな

リンク

伊藤園「おーいお茶」CMに生成したAIタレントを起用

伊藤園が「お～いお茶カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、本物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日本初になるという。同社は発表に際して「AI 技術で生成したAI model（AIモデル）を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。「お～いお茶カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

ardarim 2023/10/14

AIタレントにはスキャンダルはないとしても伊藤園自体が水素水ビジネスで世の中にケンカ売ってるから意味ない

リンク

Windowsではプロセスからプログラムに関するさまざまな情報が得られる (1/2)

Microsoftが提供するSysinternalsの「Process Explorer」を使うと、ジョブオブジェクトを調べることができる。Optionメニューの「Configure Color」でJobsのチェックボックスをオンにする。ジョブでグループ化されているプロセスに指定した色がつくコンピューターでは、プログラムを実行するとメモリに読み込まれて「プロセス」になる。プロセスからはさまざまな情報が得られる。今回は、プロセスから情報を取得する方法について解説する。その前に、プロセスや関連の用語が混乱しているので、1回整理しておこう。そもそもWindowsにおける「プロセス」とは「プログラム」とは命令の連なりであり、これを記録したものが実行ファイルだ。ほとんどのプログラムは、実行ファイルという形を持つが、プログラムがプログラムを作って、実行ファイルという形を経ずに実行させることもでき

ardarim 2023/10/02

Windows

リンク

深刻なアニメの原画マン不足「100人に声をかけて1人確保がやっと」 (1/3)

頻発したアニメ放送配信の延期、デジタル化と制作進行、アニメ業界で求められる人材……TRIGGER取締役・舛本和也さんにうかがった ■アニメ業界の働き方改革は「ファイル共有」から始まった!? 前編に引き続き、アニメスタジオ「TRIGGER」の取締役・舛本和也さんをお迎えして2023年2月に生配信したインタビューを再構成してお届けします。 ◆ まつもと　では、2つ目のコーナーにいきたいと思います。昨今、アニメの制作工程は変化していますし、これからも変化が必要であるという状況にあります。舛本さんはアニメの制作進行を目指す人向けの本を星海社さんから出版されていますし、同じテーマで同人誌も精力的に発表しています。制作進行と言われて我々がイメージするのは、アニメ『SHIROBAKO』で描かれたようなスタイルですが、それが変わってきている、あるいは変わらなきゃいけない、というようなお話もこのコーナー

ardarim 2023/09/25

リンク

アニメの放送延期が続出した原因は「海外依存8割の動仕」にあるが解決は困難 (1/3)

前編では、2022年末に起きたアニメ放送・配信の延期について、その原因と解決策をアニメスタジオ・TRIGGERの舛本和也取締役と語る〈後編はこちら〉 ■アニメの制作現場で何が起きていたのか？今回は、2022年末から2023年春にかけて多発したアニメ放送・配信の延期について、2023年2月に生配信したインタビューを再構成してお届けいたします。当時、アニメ制作の現場では、何が起きていたのでしょうか？ ◆ まつもと　今回はアニメスタジオ「TRIGGER」で取締役を務める舛本和也さんに、アニメ制作のリアルな現状を語っていただきます。舛本さん、よろしくお願いいたします。舛本　どうぞよろしくお願いします。まつもと　さっそく今日のお品書きを見ていきたいと思います。1つ目のコーナー名は……ごめんなさい。「休止」と書いていますが「延期」が正しいですね。2022年末、アニメの放送や配信の延期が相次ぎま

ardarim 2023/09/24

リンク

ドコモ回線、品質低下の一因は“通信技術”か (1/3)

先週末に東京ビッグサイトで開催された「コミケ」。個人的には「各キャリアのネットワーク品質は大丈夫かな」という心配をしながら、SNSをチェックしていた。案の定、NTTドコモのネットワーク品質がすこぶる不評なのがわかった。ダウンロード速度をチェックするアプリのキャプチャ画面が何枚も上がっており、NTTドコモのネットワークは「10年前の速度かと思った」と揶揄されているほどであった。ただ、昔と違ってネットで簡単にサブ回線を調達できるということもあり、楽天モバイルやpovoの回線で、しのいだ人も多いようだ。 NTTドコモのネットワーク品質に関しては、今年に入って「ターミナル駅周辺で遅い」と指摘されていた。同社では4月に「この夏までに対策する」と発表。先日、基地局にあるアンテナの角度や出力、指向性などの調整などをして、都内の新宿、渋谷、池袋、新橋において、概ね、ネットワーク品質が改善しているとの発

ardarim 2023/08/17

リンク

インテルの新命令セットでついに16bitモードが廃止に (1/3)

前回拡張命令の説明をしたのは連載25回なので、14年ぶり(!)である……と書いて、この連載がもう10年を軽く超えたことにあらためて気がついた。そりゃ筆者も年をとるわけだ。それはともかく、今回紹介するのは相次いでインテルが発表したx86(というよりx64)の拡張命令である。具体的にはX86-SとAPX、それとAVX10である。これらについて順に説明していきたい。 16bitモードを廃止して64bitモードに移行する提案「X86-S」 X86-Sは2023年4月に発表された、インテルによる16bitモード廃止に関する提案(Proposal)である。あくまで提案であって、今すぐ具体的に実装するという話ではないのだが、長期的にインテルとしては16bitモードを廃止したい、という意向を示したものだ。そもそも現状のWindowsの場合、64bit版では16bitバイナリーが一切動作しない。マイクロ

ardarim 2023/08/07

リンク

Windowsにおけるファイルリンクについてあらためて説明する (1/2)

Windowsを始め、多くのOSにはファイルの「リンク」機能がある Windowsに限らず、多くのOSが持つファイルシステムには「リンク」と呼ばれる機能がある。ファイルは、パスにより一意に特定可能だが、人間がファイルを管理するとき、どうしても同じファイルを別の場所（パス）にも配置したくなることがある。これを実現するのがリンクだ。リンクには、大きく「ハードリンク」と「ソフトリンク」（あるいはシンボリックリンクともいう）の2種類がある。ファイルシステムには、ファイル名を管理するディレクトリ領域とファイルの中身を記録する領域がある。ハードリンクはこの仕組みを利用して、同じファイルの中を指し示すファイル名を異なるパスに作る。特徴として、後から作ったハードリンクもオリジナルのファイル名も区別がなく、どちらも同じファイルとして扱える。通常は、ファイルシステム側に「参照カウント」と呼ばれる情報があり

ardarim 2023/07/24

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (293)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス