タグ

proto_jpのブックマーク (12,431)

  • ComfyUIで使用している拡張ノード一覧と活用アイデア|nobin@コーヒーを飲みながら紳士向けを作る人

    ComfyUIの拡張ノードを大量に入れています。 使い方が結構特殊なものもあり、この特殊系のものや計算式からtrue or falseの分岐できるなど多数ありますが、どのように活用したらいいか結構思いつかなかったり、「こうしたい!!」と思ってもエラーの連発で諦めがちです。 いろいろ入れたComfyUIの拡張ノードから使用しているものを一覧化したのと活用方法を紹介ですが、拡張ノード1つ入れるとノード200個のものとかいろんなものがあります。 ここでは、その中のほんの一部、初めて消費税が導入された%より低いと思います。 ほんのちょっぴりでも参考になればと思います。 ComfyUIでインストールしている拡張機能一覧ComfyUIのManagerは必須機能で当たり前すぎるのでここでは説明しません。 comfyui-upscale-by-model rgthree-comfy impact pack

    ComfyUIで使用している拡張ノード一覧と活用アイデア|nobin@コーヒーを飲みながら紳士向けを作る人
  • マトリョーシカ・ブレイン - Wikipedia

    マトリョーシカ・ブレイン[1]またはマトリョーシカ脳(英: matryoshka brain)は、ロバート・J・ブラッドベリー(1956年 – 2011年)[2]によって考案された、ダイソン球によって構成される巨大な計算能力を持つ仮想のメガストラクチャーである。これはクラスBの恒星エンジンの例で、恒星のエネルギーの出力全体を使用してコンピュータシステムを駆動する[3]。このアイデアは、入れ子になったロシアのマトリョーシカ人形に由来している[4]。この概念は、考案者であるロバート・J・ブラッドベリーによってアンソロジー「Year Million:Science in the Far Edge of Knowledge」で展開された[5] [6]。 マトリョーシカ人形 マトリョーシカ・ブレインの概念は、ダイソン球を使用して巨大な星型コンピューターを動かすというアイデアから生まれた。「マトリョー

    proto_jp
    proto_jp 2026/04/15
  • wd14-taggerの新モデルの追加方法の解説【eva02-large-tagger-v3/vit-large-tagger-v3】|でんでん

    こんにちは!【でんでん】です! 以前にtaggerの新モデルの追加方法について記事を書きましたが、あれからしばらく経ち、新しいモデルをSmilingWolfアニキがリリースしていたので導入方法を解説してきます。 永久保存版にしたいので、これから新しいモデルがリリースされても対応出来るように解説していきますね! 前回の記事(読まなくても大丈夫ッス) 【新作taggerモデル周りのおおまかな解説】 ▶そんなのどうでもいい人は、目次の大見出しから【新作taggerモデルを導入する方法】にジャンプ! 新モデルに対応する意義 新モデルの方が検出できるタグの精度が上がるのが基的な利点です。 それとbooru系タグは日々、使用実態に即した統廃合が進められています。そのため、昔あったタグが今はない……という事がよくあるのです。(例えばbangsタグとか) そんな中、新作の大型ファインチューニング系モデル

    wd14-taggerの新モデルの追加方法の解説【eva02-large-tagger-v3/vit-large-tagger-v3】|でんでん
  • ComfyUIでWD 1.4 TaggerとMiaoshouAI Taggerを利用したi2i(FLUX.1編)|まゆひらa

    ※ Last update 09-24-2024 ※ 5.にて、様々な画像でi2iを試みていますので、先にご覧いただければと思います。 ※ 前の記事(SDXL編)で導入したMiaoshouAI Taggerに加えて、WD 1.4 Tagger及びTagger用の新しいモデルを導入します。 ※ カスタムノードの導入方法は、Windows向けに書いてあります。 ■ 0. 概要▼ 0-0. 注意事項 記事ではi2i(image to image)を扱っています。i2iそのものが悪いわけではありませんが、他者の権利を侵害しない、ディープフェーク画像を作成しないなど、十分な注意を払ってください。 ▼ 0-1. 記事について 前の記事(SDXL編)では、ComfyUI用のMiaoshouAI Tagger(Microsoft Florence-2モデルに基づく高度な画像キャプションツール)を用いて

    ComfyUIでWD 1.4 TaggerとMiaoshouAI Taggerを利用したi2i(FLUX.1編)|まゆひらa
  • AITuber奮闘記:ローカルLLMでゲーム実況、モデル選定と配信テストの記録|与野

    前回のテストでコメント反応とゲーム実況が排他になること、ローカル LLM はゲームタイトルなどの情報を持っていないことが分かりました。コメント反応との両立は AITuberKit 側の対応待ちになるため、今回はローカル LLM でどこまでゲーム実況ができるかを確認することにしました。 テスト環境AITuberKit の設定マルチモーダル機能を有効化 カメラを有効化し、OBS の仮想カメラを設定 OBS の仮想カメラを共有 OBS の設定仮想カメラを有効化 仮想カメラの映像対象をゲーム画面に設定 ゲーム実況の仕組みAITuberKitAPI(/user_input)を使い、バッチ処理で 90 秒ごとにリクエストを送信します。AITuberKit がリクエストを受け取ったタイミングで共有されている画像を取得し、それに対してコメントを返すという流れです。 モデル選定ローカル LLM はゲー

    AITuber奮闘記:ローカルLLMでゲーム実況、モデル選定と配信テストの記録|与野
    proto_jp
    proto_jp 2026/04/05
  • 突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか

    清水 亮 ryo_shimizu 新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。 ソフトウェアの革命は、突然やってくる。 ように見える。 カリフォルニア工科大学(以下カルテック)のババク・ハッシビ教授が率いる研究チームPrismが発表したBonsai-8Bは、驚異的と言って良い性能を持つ大規模言語モデル(LLM)である。 通常のベンチマークは、ベンチマークに使うデータそのものをモデルが学習してしまう場合があるため、筆者が独自に開発した非公開の日語要約能力ベンチマークによると、Bonsai-8Bの性能は驚異的だ。 この表では、精度(ROUGE-L)、推論速度(speed)、サイズ(Size)、品質(Tier)の4点から様々なLLMの日語性能を比較している。 このベン

    proto_jp
    proto_jp 2026/04/05
  • GitHub - BeamManP/see-through-webui: "Single-image Layer Decomposition for Anime Characters" (SIGGRAPH 2026, Conditionally Accepted)

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - BeamManP/see-through-webui: "Single-image Layer Decomposition for Anime Characters" (SIGGRAPH 2026, Conditionally Accepted)
    proto_jp
    proto_jp 2026/04/05
  • Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバすぎ - Qiita

    3月31日、AnthropicのAIコーディングツール「Claude Code」の全ソースコードが突如としてネット上に流出しました。 原因はなんと、npmパッケージに含まれた .map(sourcemap)ファイル 。 Bunでビルドしたときにデフォルトで生成されるsourcemapに、元々のTypeScriptソースが丸ごと埋め込まれていたのです。 これによりソースマップ経由でソースコードが流出しました。しかし、ヤバいのはここからです。 流出→即バックアップ→DMCA連発 最初に流出を報告したのは Fried_rice 氏。 公開されたZIP(src.zip)には、Claude Codeの全アーキテクチャ、システムプロンプト、ツール群、未公開機能フラグ(KAIROS、BUDDY、ULTRAPLANなど)、Undercover Modeまで完璧に含まれていました。 すぐに realsigr

    Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバすぎ - Qiita
    proto_jp
    proto_jp 2026/04/01
  • Hermes Agent入門 — 永続メモリと自動スキル生成で成長するOSSエージェント - Qiita

    はじめに AIエージェントの多くは、セッションが終わると学んだことをすべて忘れる。毎回同じ環境説明を繰り返し、同じタスクの手順を一からやり直す。NousResearchが開発した Hermes Agent は、この「AIの健忘症」を根から解決するオープンソースのエージェントフレームワークである。 2026年3月12日にリリースされたv0.2.0では、63名のコントリビューターによる216のPRがマージされ、永続メモリシステム・自動スキル生成・マルチプラットフォームメッセージングといった機能が大幅に強化された。 この記事で学べること Hermes Agentのアーキテクチャと「成長するエージェント」の仕組み 永続メモリシステムとスキル自動生成の技術的な構造 インストールからMCP連携までのセットアップ手順 Telegram・SlackDiscord経由でのリモート運用方法 対象読者 AI

    Hermes Agent入門 — 永続メモリと自動スキル生成で成長するOSSエージェント - Qiita
    proto_jp
    proto_jp 2026/03/29
    “Hermes Agent”
  • 株おじさん|note

    投資歴13年目。メインは日個別株、12年の平均年利回りは18.9%。中長期で大儲けをたくらんでいます。実はかなりの資産を作りましたがXでは隠しています😎。 私の経験を皆さんと共有してお役に立てれば嬉しいです。億万長者を目指しましょう! ※ 記事や図表の無断転載は厳禁です!

    株おじさん|note
    proto_jp
    proto_jp 2026/03/29
  • Xユーザー数推移ツール

    アカウントパワー診断あなたのXアカウントの影響力をAIがリアルタイム分析。 ジャンル判定・影響力ランク(A〜E)・スコア(0〜100)を即座に診断します。 診断してみる

    Xユーザー数推移ツール
    proto_jp
    proto_jp 2026/03/28
  • Spectrumによる生成高速化が凄すぎた!|ひろろひ🐈‍⬛StabilityMatrixユーザー

    2026/3/26更新:当記事の執筆後、ComfyUI Spectrum SDXL Nodeがアップデートして大きな改善があったため再び検証しました。印象が変わると思いますのでこちらの記事も是非ご覧ください。 2026/3/26更新:生成時間が以前よりも増えていることについて、Dynamic Vramが有効になっていたことが原因であると追記しました。 2026/3/24更新:ステップ削減系の高速化Loraと組み合わせても無意味であることを追記しました。 2026/3/20更新:ComfyUI Spectrum SDXL Properについて、アップデートでtail_actual_stepsパラメータが追加されたため「Spectrum機能のパラメータの一覧」に追加し、説明文も追加しました。 2026/3/20更新:ComfyUI Spectrum SDXL Properとその他の実装の違いに

    Spectrumによる生成高速化が凄すぎた!|ひろろひ🐈‍⬛StabilityMatrixユーザー
  • 音楽の生成・編集が可能な高性能ローカル音楽生成AI【ACE-Step-1.5】から音楽生成AIの仕組みを完全に理解する

    最近、AI音楽を生成できるオープンソースモデル「ACE-Step 1.5」を試す機会があったので、備忘録として残します。 性能や操作感において、Sunoなどの商用モデルに匹敵するクオリティで、しかもローカル環境で動かせるという、なかなかロマンのあるモデルです。 また、このモデルはテキストからの音楽生成だけでなく、音楽の一部分修正なども行うことができ、しかもそれらの機能を単一のモデルによって達成している(マルチタスク学習)ところも面白いです。 早速ですが、実際に生成した音楽はこちらです。 歌詞付き音楽 歌詞なしBGM 上記の音楽は、ACE-Step-1.5のText2Music機能を利用して、出力したものをそのまま利用しています。 なかなか良い音楽が出力されていると思います。 とはいえ、ガチャの要素は必要なので、複数の出力から選んだものではあります。 今回、実際に実行するための方法も含めて

    音楽の生成・編集が可能な高性能ローカル音楽生成AI【ACE-Step-1.5】から音楽生成AIの仕組みを完全に理解する
    proto_jp
    proto_jp 2026/03/17
  • [DGX Spark] 卓上スパコン2台をケーブル1本で繋いで、Qwen3.5-397Bのモンスターモデルを動かしてみた - Qiita

    特筆すべきは128GBの統合メモリです。GPUCPUがメモリを共有するため、一般的なGPUのようなVRAM制限がありません。LLMのような大きなモデルをロードするのに非常に有利です。 そしてもう1つの注目ポイントがConnectX-7。200Gbpsの高速ネットワークインターフェースが標準搭載されていて、2台以上のSparkを接続してクラスタ化する「スタッキング」が公式にサポートされています。 なぜ2台必要なのか 今回動かしたいモデルはQwen3.5-397B-A17B。Alibaba Cloudが開発したMixture of Experts(MoE)モデルで、総パラメータ数は3970億です。 INT4量子化しても、モデルの重みだけで約100GB以上のメモリを消費します。1台のDGX Spark(128GB)では、モデルをロードした時点でKVキャッシュやシステム用のメモリがほぼ残りません

    [DGX Spark] 卓上スパコン2台をケーブル1本で繋いで、Qwen3.5-397Bのモンスターモデルを動かしてみた - Qiita
    proto_jp
    proto_jp 2026/03/17
  • AIでオープンソースプロジェクトをコピーせずゼロから再構築することでライセンスを独立させてしまうサービス「MALUS」

    オープンソースソフトウェアの中には「ソースコードをコピーして別のソフトウェアを作った場合、そのソフトウェアもオープンソースとしなければならない」というコピーレフト条項を含むライセンスを採用しているものが多くあります。しかし、AIの普及によって「ソースコードをコピーせずとも『ソフトウェアの動作』を指定すれば同じ機能を持った別のソースコードを生成できる」という状況が生まれています。そんな現状を風刺したサービス「MALUS」が話題となっています。 MALUS - Clean Room as a Service | Liberation from Open Source Attribution https://malus.sh/ MALUS - Thank You for Your Service: On the Obsolescence of Open Source https://malus.

    AIでオープンソースプロジェクトをコピーせずゼロから再構築することでライセンスを独立させてしまうサービス「MALUS」
    proto_jp
    proto_jp 2026/03/15
  • 【ComfyUI】イラストの手や顔を自動で修正するワークフロー|不可思議ちゃん@AI漫画でkindle出版

    【使い方ガイド:手・顔の完璧修正ワークフロー】 このワークフローには「①全自動モード」と「②手動マスクモード」の2つのルートが作られています。 状況に合わせて、不要なルートを「オフ(無効化)」にして使い分けましょう! ■ 基の準備(毎回やること) 1. 左端の「Load Image」に修正したい画像を読み込ませる 2. 下にある「チェックポイントを読み込む」で、SDXLモデルを選ぶ 3. 「Power Prompt」に、画像のトーンを上げるプロンプト(beautiful eyes などの単語)を入力する ■ モードの切り替え方(超重要!) 同時に2つのルートが動かないように、使わない方のグループを選択してキーボードの【Ctrl + B (Bypass)】を押してください。 ノードが「紫色」になれば一時的にオフ(無効化)された状態になります。 (もう一度 Ctrl + B を押すとオンに戻

    【ComfyUI】イラストの手や顔を自動で修正するワークフロー|不可思議ちゃん@AI漫画でkindle出版
  • 「色相・彩度・明度」の前提覆る シュレーディンガー色彩理論の欠陥、100年越しに数学的修正【研究紹介】 | レバテックラボ(レバテックLAB) - レバテックLAB

    山下(Seamless) 2014年から幅広い分野の研究論文をピックアップして解説しているメディア「Seamless」を個人運営。 X(@shiropen2)でも更新情報を発信中。 @shiropen2 Seamless(シームレス) 米ロスアラモス国立研究所に所属する研究者らが国際会議EuroVis 2025にて発表し、学術ジャーナルComputer Graphics Forumに掲載した論文「The Geometry of Color in the Light of a Non-Riemannian Space」は、色の3つの基属性である色相(赤、青、緑といった色味の違い)、彩度(鮮やかさ)、明度(明るさ)を、人間の色を見分ける力(色覚)だけに基づいて幾何学的に再定義した研究報告である。 ニュートンからシュレーディンガーへ。色を幾何学で捉える歴史 人間の色覚は、赤、青、緑の光に反応す

    「色相・彩度・明度」の前提覆る シュレーディンガー色彩理論の欠陥、100年越しに数学的修正【研究紹介】 | レバテックラボ(レバテックLAB) - レバテックLAB
    proto_jp
    proto_jp 2026/03/13
  • 0秒で読書!? 画期的なアプリを使ってみたら本当だった

    0秒で読書!? 画期的なアプリを使ってみたら当だった2026.03.11 10:3029,739 納富廉邦 「0秒読書」というなかなか挑発的な名前のアプリが登場した。 いくらなんでもそれは言い過ぎではないのかと思っていたところ、発売元の「ソースネクスト」からプレス用に1ヶ月のお試しアカウントをいただいたので、とにかく試したみた。 電子書籍PDF化する単機能ツールPhoto: 納富廉邦アプリとしての機能はいたってシンプル。 通常、電子書籍で購入したはテキストの抜き出しができないようになっているが、KindleやHontoなどのPC用のアプリを提供している電子書籍のページを1ページずつスクリーン・キャプチャしてくれて、その内容をPDF化してくれるという、言ってしまえば、それだけの単機能アプリなのだ。 Photo: 納富廉邦PDFで保存するときに、OCR(画像データから文字を抽出し、編集可

    0秒で読書!? 画期的なアプリを使ってみたら本当だった
    proto_jp
    proto_jp 2026/03/13
  • コマンド一発!API不要Claude不要Codex不要 完全自己完結エージェンティックAI mubo(無貌)爆誕|shi3z

    先日開催したオンラインハンズオン講座「【非エンジニア】自分専用エージェンティックAを作ろう!講座【還暦ハンズオン】」の中で言及した、「Claude codeすら使わず、MacやDGX SparkもしくはNVIDIAのGPUを搭載したPCで一発で完全ローカル駆動のエージェンティックAIが動くツール」を作った。 コマンドラインから以下のコマンド一発で必要な環境が全てインストールされ自動的に起動する。 curl -fsSL https://raw.githubusercontent.com/shi3z/mubo/main/setup.sh | bash起動すると https://localhost:8392でエージェンティックAIが起動。 動作確認は、MacBookPro(M2/32GB)と、A100 80GBのUbuntuで行っている。 エージェントの名前やUIは、インストールした環境によって

    コマンド一発!API不要Claude不要Codex不要 完全自己完結エージェンティックAI mubo(無貌)爆誕|shi3z
    proto_jp
    proto_jp 2026/03/12
  • ノア・スミス「誰も語っていないAIバブル崩壊の第三シナリオ」(2025年12月9日)|経済学101

    Art by Nano Banana ProAI がモノになるとしても,そして,すごく急速に採用がすすんだとしても,利益はうまないかもしれない 実は,AIバブルとその崩壊の可能性についてはすでにたくさん記事を書いてきた.8月には,データーセンターの資金調達をプライベートクレジットで行うと,いざバブルが崩壊したときに金融危機につながりかねないおそれがあるんじゃないかと論じた.続いて,収益性についての記事を書いて,AI 業界はみんなの予想よりもずっと競争が激しいかもしれないという考えを投げかけてみた.10月には,AIアメリカ経済を下支えしている状況について書いた. それでもさらに記事を書こうかなって思い立ったのは,ほぼすべての AI バブルに関する論議で,決定的に重要なシナリオが取り上げられずにいるのを目にしているからだ. 一連の記事を書いてから,「いまの AI はバブルだ,もうじき弾ける

    ノア・スミス「誰も語っていないAIバブル崩壊の第三シナリオ」(2025年12月9日)|経済学101
    proto_jp
    proto_jp 2026/03/11