An agent harness is the loop that drives an LLM. It sends a prompt, gets a response, executes the tool calls the model requested, feeds the results back, and repeats until the model says it's done. Every production agent has one. The question is where it runs. There are two answers. They have different security properties, different failure modes, and different implications for what the agent can
May 3, 2026 A senior engineer’s job is mostly the parts that don’t show up in the diff. Specs. Tests. Reviews. Scope discipline. Refusing to ship what can’t be verified. AI coding agents skip those parts by default. Agent Skills is my attempt to make them not optional. The default behaviour of any AI coding agent is to take the shortest path to “done.” Ask for a feature and it writes the feature.
はじめに AIにコードを書かせる開発では、docs/ 以下にMarkdownで設計書や作業計画を置くことが増えます。 たとえば、次のような文書です。 プロジェクトの要件 実装方針 作業計画 レビュー観点 テスト方針 AIへの作業指示 これらの文書は、人間が読むためだけのものではありません。AIエージェントも次の作業で読みます。 そのため、AI駆動開発では docs/ 以下のMarkdownが、AIへの指示や判断材料になります。 これは便利です。ただし、しばらく運用していると問題が出てきました。 AIが書いたドキュメントが、だんだん読みにくくなっていきました。 文法的には間違っていません。Markdownとしても整っています。でも、読むと疲れます。 この記事では、この問題を AI駆動開発における認知的負債 と呼び、textlint とAIエージェントを使って減らした方法を書きます。 最初の違
2026年4月29日にリリースされた VSCode 1.118。 今回のリリースは Github Copilot の使い方の解像度がワンランク上がる内容だった。 正直、値上げのインパクトを相殺して余りあるほどの内容だと思う。 トークンベースへの課金への移行が発表されたタイミングで、トークン効率の改善が複数入ってきたのも印象的。 個人的に刺さったものから順に紹介していく。 1. スキルの実行を別コンテキストで独立させられるようになった これ、地味に見えて本質的なアップデートだと思っている。 カスタムスキルを使い込んでいると気づくのだが、スキルが複数のツールを呼び出したり大量の参照ドキュメントを取り込んだりすると、メインのチャットコンテキストがどんどん汚染される。その結果、スキルを呼んだ後の通常の質問への回答が明らかに鈍くなったり、前のスキル実行の残滓を引きずったりする。 今回、SKILL.m
背景: 何が起きているか 2025年9月、Shai-Hulud攻撃がnpmエコシステムを直撃した。ngx-bootstrap、ng2-file-upload、@ctrl/tinycolor等の正規パッケージが改ざんされ、postinstallフックで難読化済みのbundle.jsを実行、npm/GitHub/クラウドの認証情報を窃取しwebhook経由で外部へ送信した。最終的に数百パッケージが汚染された。[1] 2025年11月のSHA1-Hulud(第2波)では、被害者をGitHub Actions self-hosted runnerに変換し、リポジトリにワークフローを注入してAWS/Azure/GCP認証情報を吸い出す手口に進化。600以上のパッケージ(Zapier、PostHog、Postman等)が影響を受けた。[2] 2026年3月にはAxiosが直接侵害された。攻撃者はメンテ
けっこう実用的。「OpenCode」×ローカルLLMで“無料Claude Code”してみた2026.05.02 13:0036,839 かみやまたくみ オープンソースのAIコーディングエージェント「OpenCode」をローカルLLM「Gemma-4-26b-a4b」で動かして簡単なゲームを作っているところ Image: かみやまたくみ AIでいろんなことができる反面、料金もけっこうかかるように。 個人的に最近すごーく気になっています。新しいAIアプリやサービスを導入したくても、コストが厳しいことが多い。 気づいたら「安く使えて実用性もあるAIやアプリはないかな?」と日々探すようになっていました。 そんな中、なかなかいい組み合わせを見つけました。 オープンソースのAIコーディングエージェント「OpenCode」をGoogleの最新ローカルLLM「Gemma 4」と組み合わせて使ってみたら、
以下の記事が面白かったので、簡単にまとめました。 ・Game development – Codex | OpenAI Developers 1. ブラウザゲームの作成1-1. はじめにゲーム開発は、Codexがコード生成以上の役割を果たす最も分かりやすい例の1つです。実際のゲーム開発には、通常、コンセプトの記述、レンダリングレイヤー、フロントエンドのシェル開発、バックエンドの状態管理、アセット制作、継続的なビジュアル調整が必要です。 このユースケースでは、Codexはまずゲームの動作内容を明確に記述することから始め、その後「Playwright」を使ってブラウザ上でゲームをテストするという反復的なプロセスで最大限の効果を発揮します。 1-2. スキルとプラグイン・Playwright ブラウザでゲームをプレイし、現在の状態を確認し、実際のビルドに合わせて操作性、タイミング、UIの感触を繰
はじめに Claude Code を開発に取り入れるチームが、ここ最近かなり増えてきているのではないでしょうか? 私はずっと GitHub Copilot を愛用していたのですが、数ヶ月前から Claude Code を使い始めました。 普段は VS Code で開発しているので、その拡張機能を入れた状態でしばらく使っていました。 便利なツールで開発が捗ることは確かなのですが、時々的外れな動作をしたり、処理に時間がかかったりして、「思っていたほど効率が上がらないな」と感じることが多々ありました。 また、X で多くの方が Claude Code を様々な方法で活用しているのを見て、自分は使いこなせていないなと感じていました。 そこで Claude Code の設定まわりを調べ、いくつかのファイル・ディレクトリを整備していった結果、開発体験が劇的に向上しました。 ざっくり言えば、新入社員のオン
How It StartedIn August 2025, I started using LLMs to code. A bit of ChatGPT here and there, then Cursor more aggressively, and then Claude Code. It was an incredible feeling. I could build an app from scratch over the weekend and have it live on the internet by Sunday. The speed was unlike anything I had experienced before. I built DanbingAI, DecodeThisText, and a few other apps. Even at my full-
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く