サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
MacBook Neo
nyosegawa.github.io
こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日はHarness Engineering(ハーネスエンジニアリング)について、2026年3月時点のベストプラクティスを徹底的にまとめていきたいと思います。 Harness Engineeringとは何か 定義を辿る Mitchell Hashimotoによる最初の定義を辿れば、Harness Engineeringとは人間によるAGENTS.mdの継続的改善と、Agentが自分の作業の正誤を自己検証するためのツール群を指していました。 現在はより大きい概念として語られることが多く、一言で言えばCoding Agentをできるだけ人間の介入なしに自律的に稼働させ、出力を安定させるためのものを指します。簡単に言えばCoding Agentの補助輪のようなものです。モデルではなくシステムが重要であり、同じモデルでもハーネスを変えるだけで
こんにちは!逆瀬川 (@gyakuse) ちゃんです 今日はOpenAIから本日リリースされたGPT-5.4について、Codexリポジトリのソースコードから読み取れるinstructionsの進化、1Mコンテキストウィンドウの有効化方法、そして他モデルとのベンチマーク比較をまとめていきたいと思います。 GPT-5.4の概要 GPT-5.4は2026年3月6日(日本時間)にリリースされたOpenAIの最新フロンティアモデルです。ChatGPT(GPT-5.4 Thinking として)、API、Codexの3つのプラットフォームで利用できます。 ポジショニングとしてはGPT-5.3-Codexのコーディング能力をベースに、知識ワーク・コンピュータ操作・ツール利用を大幅に強化した統合モデルです。公式ブログでは「our most capable and efficient frontier mo
はじめに こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日は前回の記事で「未解決の問題」として残しておいた、スキル間のAttention競合問題に正面から取り組んだ話をしていきます。作ったスキルが10個、20個と増えてきたとき、それぞれがちゃんと正しく発火しているのか。あるスキルのdescriptionを改善したら別のスキルの精度が下がっていないか。そんなポートフォリオレベルの監査を自動でやってくれるスキル、skill-auditorを作りました(現在はClaude Code専用となっています)。 skill-creatorのおさらい まず、前回の記事で深掘りしたAnthropicのskill-creatorを簡単に振り返ります。 skill-creatorは「スキルを作るためのスキル」です。ユーザーが「こういうスキルを作りたい」と言うと、以下のサイクルを回してくれます。 イン
はじめに こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日はAnthropicが公式に出しているskill-creatorというスキルを深掘りしていきます。 skill-creatorは「スキルを作るためのスキル」なのですが、このスキル自体の構造が、実はスキル設計のベストプラクティスの宝庫になっています。さらに、以前自分が作った機械学習モデルの自動ベンチマーク用スキルagentic-bench(紹介記事)との比較を通じて、「複数の処理をオーケストレーションするスキル」をどう設計すべきかを考えていきます。 そもそもAgent Skillsとは まず前提として、Agent Skillsについて簡単に説明します。 Agent Skillsは、Coding Agentに特定のタスクやワークフローの処理方法を教える命令セットで、シンプルなフォルダとしてパッケージングされます。一度教えれば
こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日はCoding Agentのワークフローで人間がボトルネックになる問題と、それをClaude Code Skillで解消した話をまとめていきたいと思います。 人間がボトルネックになっている Addy Osmaniが2026年のCodingトレンド記事でこう書いています。 Ralph loops remove human bottlenecks by allowing AI to work autonomously on long-running tasks. Netlifyの共同創業者Mathias Biilmannも2026年の予測で「人間が大量のAI生成コードのレビューに時間を費やすことになるのは本末転倒だ (backwards)」と指摘しています。 これ、実際にClaude Codeで開発しているとよくわかります。Agent
こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日はCoding Agentと一緒に開発する時代の「開発の進め方」と「組織のあり方」について、自分の実体験ベースで考えていきたいと思います。 いま何が起きているか Anthropicの2026 Agentic Coding Trends Reportによると、GitHubのパブリックコミットの4%がすでにClaude Codeによるものです。年末には20%を超えるペースだそうです。Anthropic社内ではエンジニアあたりのマージPR数が67%増加しているとのことです。 自分の環境ではChatGPT Pro ($200/月) とClaude Code Max x20 ($200/月) を併用していて、複数の離れたプロジェクトを回して現在daily 90 commit / 30,000行くらいです。負荷最小になりつつあり、最高速のマイ
こんにちは!逆瀬川 (@gyakuse) です! 今日はともだちのDiscord botがプロンプトインジェクションされてIP開示されていた件をきっかけに、3層防御ライブラリ「openclaw-defender」を作った話をまとめていきたいと思います。 前日譚: 友人のbotが攻撃されていた ともだちのニケちゃん (@tegnike) がDiscordでOpenClawベースのbotを公開していました。OpenClawはAIエージェントフレームワークで、Discord botとしてデプロイできるものです。 早速、IP開示されたりプロンプトインジェクションされたりとても楽しそうにしていました。 わたしも「プロンプトインジェクションしたいな〜」と思ったのですが、冷静に考えると今後OpenClawのセキュリティはどんどん強化されていく可能性が高い。完璧に強化されたものでも攻撃できる術をもてるよう
こんにちは!逆瀬川 (@gyakuse) です! 今日は「AGENTS.mdを自動で育てたい」という話をしていきたいと思います。作ったものはagents-md-generatorとして公開しています。 CLAUDE.mdを毎回考えるのがつらい Coding Agentを日常的に使っていると、新しいリポジトリを作るたびに頭を悩ませるものがあります。CLAUDE.md(あるいはAGENTS.md)です。 何を書くか毎回考えるのがまずつらい。プロジェクトのビルドコマンドは?テストの走らせ方は?コード規約は?まだ何もコードがない段階でこれを考えるのは不毛です。かといって空のまま放置すると、Coding Agentが手探りで動くことになって効率が悪い。 もっと根本的な問題もあります。CLAUDE.mdは書いた瞬間から劣化し始めます。プロジェクトが進めばコマンドは変わるし、アーキテクチャも変わる。でも
Stopイベントには追加で stop_hook_active(無限ループ防止用フラグ)が、Notificationイベントには notification_type と message が含まれます。 settings.jsonの設定 { "env": { "CLAUDE_DISCORD_WEBHOOK_URL": "https://discord.com/api/webhooks/..." }, "hooks": { "Stop": [ { "hooks": [ { "type": "command", "command": "python3 $HOME/.claude/hooks/discord-notify.py", "async": true } ] } ], "Notification": [ { "matcher": "", "hooks": [ { "type": "comma
こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日はMCP(Model Context Protocol)の「太さ」問題と、それをAgent Skillを使って解決する「MCP Light」というアプローチについてまとめていきたいと思います。 MCPの役割はConnector MCP(Model Context Protocol)の役割が明確になってきました。「AIアプリケーションのUSB-C」という比喩が示す通り、MCPはConnector — AIモデルと外部ツール・データを繋ぐ標準プロトコルです。 月間9,700万以上のSDKダウンロード、10,000以上のパブリックサーバー。OpenAI・Google・Microsoftも採用し、事実上の業界標準になりました。Notion、GitHub、Slack、Salesforce…あらゆるSaaSがMCPサーバーを公開し、AIエージ
こんにちは!逆瀬川 (@gyakuse) です! 今日はClaude CodeのMCP連携を使って、NotionとLinearとコードベースに散らばったプロジェクト情報をLinearに一気に統合した話をまとめていきたいと思います。やってみたら結構うまくいったので、その手法をClaude Code Pluginとして汎用化して公開するところまでやりました。 問題: 情報が3箇所に散らばっている 開発プロジェクトを進めていると気づいたら情報がバラバラになりがちです。 Notion: 設計ドキュメント、仕様、TODO、ミーティングメモ Linear: issueとしてのタスク管理 Git: 実装コード それぞれ単体では機能しているのだけれど、こういう状況が生まれる。 Notionに書いた仕様が実装と乖離している(書いてあるが未実装、または実装したがNotionに反映されていない) Linearの
このページを最初にブックマークしてみませんか?
『nyosegawa.github.io』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く