Claude Managed Agents は Claude を自律的なエージェントとして動作させるためのハーネスとインフラストラクチャーを提供します。長時間かかるタスクや非同期のタスクを実行するために使用するのが想定されています。この記事では実際に Claude Managed Agents を試してみた内容を紹介します。 クラウドホスト型エージェントを大規模に構築・展開するためのサービスである Claude Managed Agents がパブリックベータとしてリリースされました。Claude Managed Agents は Claude を自律的なエージェントとして動作させるためのハーネスとインフラストラクチャーを提供します。長時間かかるタスクや非同期のタスクを実行するために使用するのが想定されています。 自律的に動作するエージェントを動かす環境を作ろうとすると、安全なサンドボック
はじめに Claude でちゃんとした「自律エージェント」を本番で動かそうとすると、いつも同じ壁にぶつかります。Messages API の上にエージェントループを書き、ツール呼び出しを捌き、サンドボックス付きの実行環境を用意し、セッションの会話履歴とファイルシステムを永続化し、長時間タスクのチェックポイントを作り、スケーリングとモニタリングを整える — ここまでやってようやくユーザーに提供できる状態になります。多くのチームがこの「ハーネス部分」で時間を溶かしてきました。 Anthropic はこのハーネスをマネージドサービスとして提供する Claude Managed Agents を public beta として公開しました。beta ヘッダー managed-agents-2026-04-01 を付けるだけで、/v1/agents・/v1/environments・/v1/sess
こんにちは、キャディで Quote というアプリケーションを開発している plant こと石田 (@plant_ja) です。 ハーネスエンジニアリングという言葉を目にする機会が増えてきましたね。「何をやるべきか」については OpenAI の Harness engineering: leveraging Codex in an agent-first world や逆瀬川さんの Claude Code / Codex ユーザーのための誰でもわかるHarness Engineeringベストプラクティス が非常に参考になります。 本記事では「何を」ではなく「どう始めるか」に焦点を当てています。Claude Code の場合だと Rules、Skills、Hooks、Subagents、さらには custom linter や pre-commit や pre-push、これらの構成要素を眺
Run GitHub Actions on your machine.Caching in ~0 ms. Pause on failure. Let your AI agent fix it and retry — without pushing. ❯ npx agent-ci run --workflow .github/workflows/ci.yml Initializing local runner environment... Mounting local workspace: /Users/dev/project Starting job: test-and-build ✓ Run actions/checkout@v4 (0s) ✓ Run actions/setup-node@v4 (0s) ✓ Run npm install (0s - cached) ▶ Run npm
はじめに 何が辛かったのか 毎回詳細なプロンプトを書くのが辛い AIエージェントのタスク完了まで面倒を見るのが辛い これらを並列で実行しているのが辛い 解決方針 詳細な設計ドキュメントの作り込み Usecase Design Doc 細かい実装指示・計画・実行をAIエージェントに委譲 タスクの分割方針 AIエージェントへの実装委譲 AIのお世話からの解放 - 得られた成果 開発速度の向上 PRレビュー自体の認知負荷の軽減 現在直面している課題 設計書の細かい誤りの増幅 設計とPRレビューのボトルネック化 まとめ はじめに こんにちは。CADDi Quoteのサーバーサイドの開発を担当しています、majimacchoです。私たちのチームでは全員がAIエージェントを活用して実装しPR作成まで行なっています。 私自身を含め、全く自分でコードを書かなくなったメンバーもいます。AIエージェントを使っ
2ヶ月で21体のAIエージェントによる自律開発パイプラインを構築した。GitHub Issueに要求を書いて寝れば、朝にはマージレディのPRが上がっている。本記事では、2026年2〜3月に何を作り、何が動き、何がまだ動いていないのかを記す。 出発点は、2月時点で既に 57万行 に膨れていたモノレポだった。モバイルアプリ+管理画面+バックエンドが詰まったこのコードベースを、AIエージェントに正しく理解させ、自律的に開発させる——それがこの2ヶ月の挑戦だった。 2025年12月〜2026年3月のマージPR数推移。2月後半のハーネス整備期を経て、3月後半には681件/半月まで急増。なお、この数値にはドキュメント更新等のPRも含まれるため、あくまで参考値である。 1. 我々について — 2ヶ月前の課題 専任のエンジニアはいない。代表と私が要件を決め、それを学生エンジニア数名とフリーランスに依頼して
2025/3/29 19:00 更新 — セクション9「5分で体験するCoDD」を大幅改善。要件定義を平文で渡すだけのフローに変更(codd init --requirements spec.md)。フロントマターもwave_configも全自動生成。 この記事はいつもと毛色が違う。体験記ではなく論考だ。 AI開発の方法論がこの2年で3回変わった。プロンプトエンジニアリング、コンテキストエンジニアリング、ハーネスエンジニアリング。オレは全部リアルタイムで通過してきた。AI部下10人を戦国軍団で運用しながら。 で、3つ全部やった先に、誰も解いていない問題があった。 それを解くツールを作った。pip install codd-dev で公開した。結果、クライアント案件のLMSで要件と制約だけ渡して、設計書18本・全コード・全テストをAIに生成させた。 途中で設計判断が変わっても、壊れなかった。
本稿では、AIエージェントの出力品質は「構造」で大きく変わるという前提のもと、CLAUDE.mdの次のパラダイムとして注目される「ハーネスエンジニアリング」の概念・構成要素・導入方法を、実運用の経験を交えて解説します。 なぜハーネスが必要になったのか 半年ほど前、筆者はCLAUDE.mdだけでプロジェクトを回していました。 コーディング規約、ディレクトリ構成、技術スタックを書いておけば、AIは概ね期待通りに動きます。 最初のうちは。 問題はプロジェクトが大きくなってから出ました。 品質のばらつき: 同じ「APIエンドポイントを追加して」という指示でも、セッションによってファイル配置やエラーハンドリングの粒度が違う セッション切れの断絶: 昨日の作業の続きを頼むと、前回の設計判断を無視した実装が返ってくる スキル追加の破綻: /deploy /write-test のようなスキルを20個以上
Issue-Driven AI Development の実践ガイド 🚀 すぐに試したい方へ: テンプレートリポジトリをフォークして始められます! 💡 スクラッチから開発したいかたへ: Claude Codeでスクラッチから開発する実践ガイド 目次 はじめに Claude Codeとは 基本的なワークフロー テンプレートリポジトリ GitHub側の事前設定 安全運用のための3つの基本原則 Issue Templateの設計 コミット規約 プロジェクト構成の推奨 ai_docs/の重要性と運用 タスクが不明瞭な場合の対処法 実運用のためのガードレール 注意点 まとめ はじめに Claude Codeは、ターミナルから直接Claudeにコーディングタスクを委譲できる強力なツールです。本記事では、GitHub IssuesとClaude Codeを組み合わせて、効率的な開発ワークフローを構築
最近、ハーネスエンジニアリングという言葉をよく耳にします。 現時点で自分が見かけたいくつかの記事について、内容と理解を整理しておきます。だいたい OpenAI のやつ 6 割、他 3 割、自分の意見 1 割という感じです。 ハーネスエンジニアリングとは ハーネスエンジニアリングという名称を使い始めたのは、自分の観測範囲だと Mitchell Hashimoto 氏のブログに登場するのが最古かなと思います。 (概念自体は前からあったので、誰が言い始めたかは重要ではないですが) I don't know if there is a broad industry-accepted term for this yet, but I've grown to calling this "harness engineering." It is the idea that anytime you find
この記事では、Claude CodeとFigma MCPを使って「Figmaのデザインを高い再現度で実装に落とし込む」ためのワークフロー設計を紹介します。 Figma MCPのデザインコンテキストはサイズが大きく、そのままAIに渡すと再現度が不安定になりがちです。そこで本記事では、タスク分割とPlaywright検証を組み合わせたパイプラインを構築し、スクリーンショット比較やレイアウト差分として検証できる状態まで落とし込むことを目標にしました。 はじめに REALITY で Server エンジニアをしているあさだです。今回は Claude Code に触れる機会があり、実際に試した内容を記事としてまとめさせていただきます。 本記事では Claude Code と公式の Figma MCP を使い、Figma のデザインコンテキストから REALITY の Web フロントエンド(Vue)
はじめに:AI開発ツールの「落とし穴」 AI開発アシスタントを使っていて、こんな経験はありませんか? 要求を投げると大量のコードが生成されるが、実行すると エラーだらけ ビジネスロジックが不完全で、結局人間が大幅に修正 前日に書いたコードと今日書いたコードで一貫性がない これらの問題の根本原因は、現在のAI開発ツールが「素直すぎる」ことにあります。つまり、立ち止まって考えることなく、機械的にコードを生成してしまうのです。 この課題を解決する注目のプロジェクトが、2026年1月にGitHub Trendingを席巻し、29,000+ Starを獲得したSuperpowersです。 Superpowersとは? Superpowersは、Claude Code向けのプラグインで、AIに**「ベテランエンジニアの作業フロー」を強制的に組み込む**ツールです。 驚異的な成長:数ヶ月で29,000+
We've encapsulated 10+ years of React and Next.js optimization knowledge into react-best-practices, a structured repository optimized for AI agents and LLMs. React performance work is usually, well, reactive. A release goes out, the app feels slower, and the team starts chasing symptoms. That’s expensive, and it’s easy to optimize the wrong thing. We’ve seen the same root causes across production
開発環境現状確認(2026年) - Don't Repeat Yourselfという記事を見かけたので僕も書いてみることにする。 Terminalエミュレータ WezTermとGhostty(ほぼWezTerm) 2つを併用しているが、基本はほとんどWezTerm。Ghosttyも使えるように設定しているが、以前のバージョンは仕事の環境で使っていたところクラッシュが頻発したので、結局WezTermを使う運用になっている。Appleプラットフォーム的にはGhosttyの方がネイティブUIに近くて良さそうだけど……。 両方ともカスタムしていて同じように使えるようになっていてどちらも使える。 設定ファイルはこちら。 WezTerm / Ghostty フッターは頑張ってデザインした Terminal Multiplexer WezTermの組み込みMultiplexer / tmux WezTe
目次 はじめに なぜCodex MCPを活用するのか Codex MCPの活用方法 知識ドキュメントの重要性 実際の活用例 活用の成果と今後の展望 0. はじめに はじめまして、AI事業本部 極AIでMLエンジニアをしている吉原 (X:@sou_squared) です。 僕は普段からAIを活用した開発効率向上に興味を持っており、いろいろ試行錯誤をしております。そんな中、Codex MCPに設計や実装案を任せ、なるべく自分はコーディングしないようにしていたら、いつのまにかCodex利用率社内3位にランクインしていました。本稿では、その背景と具体的な活用方法、実際のワークフロー、そして得られた知見について詳しく解説します。 1.なぜCodex MCPを活用するのか AI Codingを用いた開発に置いて責務を分離するためです。 僕はメインエディタとしてCursorを使用しています。そこで、計画
CLAUDE.md は LLM にコードベースを理解させる最重要ファイル。WHY/WHAT/HOW の3要素を300行以内で簡潔に書き、指示は最小限に。段階的開示で詳細は別ファイルに分離し、リンターや自動生成には頼らないのがベストプラクティス Claude Code を使っていて、なんか思い通りに動かんなって感じたことない?指示を書いてるはずなのに無視される、毎回同じことを説明し直さなあかん、コードスタイルがバラバラになる こういう問題の多くは、実は CLAUDE .md の書き方に原因があったりするんよね X で 毎日 AI 情報を配信してるコムテです。Agentic AI / AI 駆動開発などを中心に情報を配信しています この記事は HumanLayer のブログ記事「Writing a good CLAUDE .md」をベースに、Anthropic の公式ドキュメントと最新の学術研
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く