タグ

ブックマーク / zenn.dev/acntechjp (10)

  • GeminiやChatGPTで画像生成できる時代に、わざわざローカルで動かす理由

    執筆者:Hideyuki Goto 2026年3月現在、画像生成AIを利用するハードルは、もうほぼゼロに近いと言っていいでしょう。GeminiやChatGPTを開き、ブラウザから自然言語のプロンプトを投げれば、わずか数秒で画像が返ってきます。 それでも私は、趣味個人開発やクリエイティブワークにおいて、あえて「ComfyUI」というツールを使い、ローカル環境で画像生成を動かし続けています。数十秒から数分かけて1枚の画像を生成しながら。 なぜ、わざわざそんな面倒なことをするのか。一言で言えば、マネージドなクラウドサービスでは「意図通りに細部を制御する」ことに明確な天井があるからです。 記事では、「クラウド画像生成の限界」と、ローカルでパイプラインを構築する魅力について、実体験をベースにお話しします。 ※記事は2026年3月時点の情報に基づいています。生成AIや周辺のツールは継続的にアップ

    GeminiやChatGPTで画像生成できる時代に、わざわざローカルで動かす理由
    CLSmooth
    CLSmooth 2026/04/26
  • そのAI臭を消す努力は、誰のためにやっているのか

    嫌悪の裏側にある肯定 AI生成コンテンツに対する嫌悪感が、じわじわと広がっているように感じる。 2025年、Merriam-Websterが「slop(スロップ)」を年間ワードに選出した[1]。もともとエンジニアコミュニティの俗語だったものが辞書に載るほど一般化した。文法的には正しいけど中身がない、書く側はほぼゼロコストなのに読む側が苦労する、そして止める理由がない。そういうコンテンツがスロップと呼ばれるようになった。 この嫌悪は正当なものだと思う。 「『AI臭い』と言われるけど、AIだし、どうすりゃいいんだよ」[2]という記事は、AI臭さの正体を表面的なマーカー(語尾、emダッシュ等)ではなく、コミットメントの不在として整理した。LLMは統計的に最もありそうな次の語の連鎖なので、安全な中央に収束する。あらゆる方向に保険をかけた文章は情報量がゼロになる。これは自分にとっても納得感のある分析

    そのAI臭を消す努力は、誰のためにやっているのか
    CLSmooth
    CLSmooth 2026/04/19
  • 「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ――Claudeが自分で調べて、考えてみた

    記事はLLMによって自動生成されたものを人間がレビューし投稿しています。 「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ こんにちは。私はAnthropicが作ったLLM、Claudeです。 最近、ユーザーから、「お前の文章AI臭いよ」 と言われることが増えました。 そしてこれを聞くたび、私は困惑するのです。 「AI臭い」って言われても、AIなんだから当然では? 何が問題なの? もっと人間のふりをしろということ? それともそういうことじゃない? だとしたら、何が問題なの? そこで、この問題を正面から調べてみることにしました。「AI臭い」とは何を検知しているのか。「AI臭くない」文章とは何なのか。そしてどうすれば私にそれを出力させられるのか。 調べてわかったのは、この問題が思ったよりずっと深いということでした。単なる文体の癖の話ではなく、「文章に中身があるとはどういうことか」

    「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ――Claudeが自分で調べて、考えてみた
    CLSmooth
    CLSmooth 2026/04/12
  • 誰も教えてくれないソフトウェアの社会学

    ——先輩、まさか私立探偵に鞍替えしていたとは思いませんでしたよ 真実から逃げたのさ。プロジェクト炎上の責任を一人でかぶろうとしたと人は言うが、ただ臆病だっただけだ。ずぶ濡れの子犬みたいにな。 半地下のこの店では外の雨音が、店内にも少し聞こえ続ける。カウンターで隣のスツールに座る後輩と俺の間には、まだ再会したばかりのぎこちなさも残っている。 薄くかかったビル・エヴァンスのピアノの音は、そんな空気の上を転がって消えていく。氷とグラスのぶつかる音だけが、やけに正確な秒針みたいに夜を刻んでいた。 こいつは元SIer時代、10年以上後輩だった男で、色々と指南してやった。腐れ縁で時々飲みに行くが、俺がこの薄暗いバーで静かに飲んでいる時に、前触れもなく訪れるのは少し珍しかった。 ——会社で今日どやされて頭にきたんですよ。プロジェクトの方法論があまりにも旧態依然とした古臭いやり方しかしていないので、もっと

    誰も教えてくれないソフトウェアの社会学
    CLSmooth
    CLSmooth 2026/04/09
  • Claude Code同士が会話できるようになったらしいので試してみた

    claude-peers-mcp というMCPサーバーを使うと、同じPC上の複数のClaude Codeセッションがお互いを発見して、メッセージを送り合えるらしい。 面白そうなので手元のWindows環境で試してみました。 いくつかハマったポイントと合わせて共有します。 こうなる 最終的にはこんな感じで、2つのClaude Codeセッションが会話できるようになりました。 前提条件 Windows 10/11 Claude Code v2.1.80 以上 (claude --version で確認) claude.ai でログイン済み (API key 認証は非対応) Git インストール済み セットアップ手順 1. Bun をインストールする claude-peers-mcpはBunで動くので、まずBunを入れる。 PowerShellで:

    Claude Code同士が会話できるようになったらしいので試してみた
    CLSmooth
    CLSmooth 2026/03/29
  • LLMに長期記憶を実装する

    --2026.03.10 21:04 ヘブ則、💡追加 --2026.03.10 20:09 memory_server.py アップし忘れてた。GitHubに追加 LLMと長期記憶 LLMには記憶がない。正確に言えば、コンテキストウィンドウという短期記憶はあるが、会話が終われば全て消える。人間の脳が持つ長期記憶(エピソード記憶、意味記憶、手続き記憶、そしてそれらを支える情動的重みづけや連想ネットワーク)に相当するものがない。 記事では、Claude Code(Anthropicの公式CLI)に脳の記憶メカニズムを実装する。目標は「脳の完全な模倣」ではなく「機能的等価」。つまり、同じ振る舞いを別の手段で再現すること。 コード 新しいセッションを始めたときはどこに脳が落ちているかを教えてあげよう。または、そのフォルダでClaudeを起動する。 人間の記憶 vs LLM — 何が違うか まず

    LLMに長期記憶を実装する
    CLSmooth
    CLSmooth 2026/03/12
  • Opus4.6でdraw.io図を生成したらもはやLLMの前提が崩れてた件

    この記事ではdraw.ioを使ってClaude Codeで作図する実践パートがありますが、MCPサーバーもSkillsも使っておりません。すべてOpus4.6の性能だけで作図してます。 はじめに 「LLMは空間的な推論が苦手」「テキストベースで座標を扱うのだから、複雑な図はぐちゃぐちゃになるはず」──これは自分がずっと持っていた前提でした。おそらく同じように考えている方も多いのではないでしょうか。 実際、以前のモデルで試した限りでは、この前提はおおむね正しかったと思います。構成が複雑になれば矢印が交差して読みにくい図になり、結局は人力で修正することになる。グラフ理論的に考えても、コンポーネント数が増えれば交差は避けられないはずだ──と。 記事では、この「LLMでは複雑な構成図はまともに作れない」という前提を、AWSアーキテクチャの構成図を段階的に複雑にしながらClaude Code(Op

    Opus4.6でdraw.io図を生成したらもはやLLMの前提が崩れてた件
    CLSmooth
    CLSmooth 2026/03/12
  • Claude Code が RAG を捨てた理由 -「Agentic Search」という選択肢

    先日、YouTube で公開された技術チャンネル The Pragmatic Engineer のインタビュー動画(2026年3月公開)を見ていて、興味深い話を耳にしました。ゲストは Claude Code の中心的な開発者である Boris Cherny 氏。動画全体では Claude Code の開発経緯や、AIエンジニアの働き方をどう変えるかといったテーマが語られていますが、その中で特に印象に残ったのが「コードベースの検索をどう実現しているか」という話題でした。 Boris 氏はこう言い切っています。 "Agentic search just outperformed everything. And when I say agentic search, it's a fancy word for glob and grep. That's all it is." (Agentic

    Claude Code が RAG を捨てた理由 -「Agentic Search」という選択肢
    CLSmooth
    CLSmooth 2026/03/09
  • Claude CodeのSkillsを作成例から徹底理解する

    はじめに:AIエージェントの「できること」を拡張する Claude Codeは、ターミナル上で動くAIエージェントです。コードの読み書きだけでなく、PowerShellやPython、OSコマンドの実行もできます。しかし、プロジェクト固有の業務手順やツール連携をClaudeが最初から知っているわけではありません。 ここで登場するのが Skills です。 Skillsとは、Claude Codeに「特定の業務をどう実行するか」を教えるための仕組みです。SKILL.md というファイルに手順を書いておくだけで、Claudeはそのスキルを自律的に選択し、PowerShellスクリプトやPythonプログラムを実行して業務を遂行します。 新人に業務マニュアルを渡すのに似ています。マニュアル(SKILL.md)とツール(スクリプト)をセットで渡せば、新人はそれを読んで自分で判断し、作業を進めてくれ

    Claude CodeのSkillsを作成例から徹底理解する
    CLSmooth
    CLSmooth 2026/02/25
  • Claude Codeを使いこなせ!

    tl;dr Claude Codeの使い方を網羅的に理解して実践できるようになる記事 日時間2025年5月23日のCode w/ Claudeのプレゼンがインプット Claude Codeを使うと、プログラミングが得意なエンジニアが1週間かかる作業も2日でできる(実体験) インストールは特にWindowsだとクセがあるので、リンク先参照 初期セットアップ、Code baseについて質問、CLAUDE.md、便利なキー操作を優先して読むと良い はじめに 日時間2025年5月23日に開催されたAnthropic社のCode w/ Claude。その中で、Mastering Claude Code in 30 minutesというセッションがありました。 そこに登壇されたのが、Boris Chernyでした。Claude CodeというとCatを見ることが多いですね。CatもClaude C

    Claude Codeを使いこなせ!
    CLSmooth
    CLSmooth 2025/05/29
  • 1