k1LoWのブックマーク - はてなブックマーク

40,000行のAPIテスト作成で学んだClaude Code Skillsの育て方 - カミナシエンジニアブログ

こんにちは、ソフトウェアエンジニアの渡邉（匠）です。「カミナシ設備保全」の開発に携わっています。 Claude CodeのSkills（以下スキル）を使い、約2週間で40,000行超のAPIシナリオテストを書き切りました。最初のスキルは粗削りでしたが、テストを量産する中で繰り返し改善した結果、後半は「スキル実行 → レビュー → マージ」のサイクルだけで回せるようになりました。この記事では、スキルをどう設計し、どう育てたかを中心にお伝えします。背景 APIの動作保証にシナリオテストツール runn を使っていました。サービス成長に伴うAPIの増加により、当初のテスト構成では運用が回らなくなってきました。1ファイルあたりのステップ数が膨らみ、どこで何を検証しているのか判別が難しい状態に。テストの追加・修正が心理的にも技術的にもハードルの高い「辛い作業」へと変わっていました。そこで、

k1LoW 2026/03/18

40,000行!!!!!! runnの利用事例としてもかなり大きいのでは？

リンク

やることの決まっていないタスクしか残らない - Runner in the High

ここ最近AIを使った開発をしていて思うこと。ローコンテキストなものは期待するアウトプットと差分が出ずらいので、雑にAIに依頼しやすい。「こうやればいけそうだなー」くらいのある程度ゴール感が見えているようなやつも、AIにやらせておけばいい。となると、仕事上残るのは以下のカテゴリしかなくないか? と思う今日この頃。ハイコンテキストなもの過去にされた何気ない会話だったり、別チームとのディスカッションで得られた決定事項を具体化して、デリバリするところまでがスコープになっているようなもの。あとは、明文化されていないが、なんとなくその組織のなかで共通認識になっている思想とかからくる機能開発や改修。だいたい、こういうやつは不確実性も高い。不確実性が高い実際に作ってみた上で、それを運用して出てくる課題の収集だったり、他の人間からのフィードバックを得るみたいな、ワンショットでは終わらないロングスパ

k1LoW 2026/03/17

わかる

リンク

You Need to Rewrite Your CLI for AI Agents

npx skills install jpoehnelt/skills/agent-dx-cli-scale Human DX optimizes for discoverability and forgiveness. Agent DX optimizes for predictability and defense-in-depth. These are different enough that retrofitting a human-first CLI for agents is a losing bet. I built a CLI for Google Workspace — agents first. Not “built a CLI, then noticed agents were using it.” From Day One, the design assumpti

k1LoW 2026/03/05

リンク

How to Kill the Code Review

Second wave speakers for AIE Europe and CFP for AIE World’s Fair are announced today, and OpenCode is confirmed for Miami! We’ll also be in Melbourne & Singapore. Editor: This is the latest in our guest post program, where we will publish AI Engineering essays worth considering, even if we don’t personally agree with them — having just shipped an AI review tool, this is one of those cases where I

k1LoW 2026/03/04

リンク

THE 2028 GLOBAL INTELLIGENCE CRISIS

PrefaceWhat if our AI bullishness continues to be right...and what if that’s actually bearish? What follows is a scenario, not a prediction. This isn’t bear porn or AI doomer fan-fiction. The sole intent of this piece is modeling a scenario that’s been relatively underexplored. Our friend Alap Shah posed the question, and together we brainstormed the answer. We wrote this part, and he’s written tw

k1LoW 2026/02/26

リンク

Claude Code に既存のフローに沿って Git Worktree を使わせる - お雑煮研究会

Claude Code 2.1.49 で --worktree (-w) オプションが追加され、Claude Code を独立した Git Worktree 内で起動できるようになりました。 Added --worktree (-w) flag to start Claude in an isolated git worktree https://github.com/anthropics/claude-code/blob/main/CHANGELOG.md#2149 しかし私は Git Worktree の管理に k1low/git-wt を使用しており、挙動が自分の作業フローと合わないことからこの機能をそのまま使うことはできませんでした。 github.com その後、Claude Code 2.1.50 で WorktreeCreate / WorktreeRemove Hook が

k1LoW 2026/02/24

すごい。完全にgit-wtに置き換えている

リンク

Microsoft Entra ID の検証環境を作ろう - ラック・セキュリティごった煮ブログ

ペネトレーションテストを担当してますWHIです。皆さんペネトレーションテストしてますか？オンプレのActive Directoryだけで満足してませんか？昨今のOA環境のインフラ情勢として、従業員向け端末の管理はADに代わってEntra IDやその両方を同期するハイブリッド型に移り変わりつつあります。ペンテスターもそのような変化に追従して日々新しく採用される技術スタックへのペネトレーションテスト能力の研鑽が望まれる時代です。 OSCPなどを受講した方はわかってくれるかと思いますが、いち早くペンテストの腕を身に着けるには実際の環境をいじくり倒す他ないでしょう。そのような時必要になるのが検証環境です。この記事ではEntra IDの検証環境を無料で作成する方法をご紹介します。 Microsoft Entra IDのプラン Entra IDのプランとして明示的に販売されているのはP1や

k1LoW 2026/02/23

リンク

AIプロダクトの品質をどう守る？

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest. →

k1LoW 2026/02/19

品質維持のためのリグレッションテスト用途でのrunn活用。なるほど。ありがとうございます！

リンク

runn と Skills ではじめる結合テスト

はじめにはじめまして、株式会社カナリーの nu0ma です。本記事では runn を使った結合テスト自動化の取り組みや Skills を使用したテスト生成について紹介します。背景 AI による開発支援が急速に進み、コーディングの速度は今までにない速さになりました。エディターを開かずにPR作成することもしばしばあります。しかし、生成されるコードの量が増えるほど振る舞いを担保する仕組み、つまりガードレールの重要性も増していると感じます。このような現状に対して、現在runn を使ったシナリオベースの結合テスト自動化に取り組んでいます。本記事ではその内容を紹介します。 runn とは runn とは Go で書かれたシナリオベースのテストツールです。テストシナリオを YAML で記述し、HTTP リクエストや gRPC リクエストなどを送信し、レスポンスを検証できます。さらに、DB Runne

k1LoW 2026/02/18

ご利用ありがとうございます！Skills参考にします！

リンク

tmuxのウィンドウで動かしているコーディングエージェントのステータスを確認できるtcmuxを作った - Copy/Cut/Paste/Hatena

tmuxはCoding agentのためだけのものではないんだよ。我々はもともとtmuxを使ってシェルやらEmacsやらVimやらをまとめていたんだ。ただ、そこにCoding agentが加わっただけなんだ。というイライラを解消した。 pic.twitter.com/M0DXBm3jpo— k1LoW (@k1LoW) 2026年1月28日普段使っているtmuxにClaude Codeの情報がほしい私は普段からtmuxを使っています。Emacsを開いているウィンドウ、シェルを開いているウィンドウ、特定の作業をしているブランチのウィンドウ、別のリポジトリのウィンドウといった感じで複数のウィンドウを行き来しながら作業しています。最近はClaude Codeを使うことが増えてきて、tmuxのウィンドウのいくつかでClaude Codeが動いている状態になりました。あるウィンドウではバ

k1LoW 2026/02/14

書きました

リンク

I Started Programming When I Was 7. I'm 50 Now, and the Thing I Loved Has Changed | James Randall

James Randall Musings on software development, business and techno logy. I Started Programming When I Was 7. I'm 50 Now, and the Thing I Loved Has Changed I wrote my first line of code in 1983. I was seven years old, typing BASIC into a machine that had less processing power than the chip in your washing machine. I understood that machine completely. Every byte of RAM had a purpose I could trace. E

k1LoW 2026/02/12

リンク

「アンチパターン」と呼ばれるEAVを、あえて採用した話 ── 数十万件の属性、数十億件の値と向き合って

はじめに株式会社イエソドのCEO兼CTOの竹内(@chimerast)です。データベース設計の書籍やブログを読むと、EAV（Entity-Attribute-Value）は「アンチパターン」として紹介されることが少なくありません。SQLアンチパターンの代表格として挙げられ、「やめておけ」と言われがちな設計パターンです。しかし、筆者はこれまで2つのBtoB SaaSプロジェクトでEAVを採用してきました。1つ目は、前職ユーザベースの全世界の数百万社の企業および数十万件の勘定科目、数十億の値を扱う「Speeda」という大規模な経済情報サービスの財務諸表機能。2つ目は、現職イエソドの人・組織・会社・オフィス・プロジェクトといった多様なEntityの関係性を管理する、「YESOD」という企業内の人・組織をマスタ管理した上でシステムのアカウント管理に繋げる大規模ID管理サービスです。どちらのプ

k1LoW 2026/02/11

リンク

データモデルのイベントの期間の設計のコツ - そーだいなるらくがき帳

アプリケーションを開発するときに期間を表すデータを扱うことは珍しくない。例えばイベントの開催時間、タスクの予定時間などである。実際にイベントの開催をDBに保存する場合によく見るテーブルは以下のようなものだろう。 CREATE TABLE events ( id SERIAL PRIMARY KEY, name VARCHAR(255) NOT NULL, start_at TIMESTAMP NOT NULL, end_at TIMESTAMP NOT NULL ); このテーブルはCopilotが提案してくれたもので、開始時間と終了時間をそれぞれ start_at と end_at カラムで保存している。実際にみんなも現場でよく見る設計ではなかろうか。 AIが一発で提案してくるくらいには一般的な設計である。ただ、期間を一つのテーブルに持たせることは常にベストというわけではないとい

k1LoW 2026/01/27

また私が何度もお世話になる名エントリになっていく予感がする

リンク

git-wtを導入した - koicの日記

git-wt を導入したので、メモとして導入ログを記しておく。 github.com 導入動機導入ログインストール設定導入動機 Agentic Coding によってにわかに脚光を浴びている git worktree だけれど、実際のところワークツリーディレクトリどこに置くの？といった話などちょっとした敷居がある。特に ghq ユーザーにとっては、ghq root (e.g, ~/src, ~/ghq) のディレクトリの直下にワークツリーを置くような運用だと、いかにも管理がしづらいのでどうするかという問題があった。今回 songmu さんによる以下の神機能が入ったということで、個人的には git-wt が顧客が本当に求めていたものになったので導入することにした。 github.com 正直 ghq root 直下にリポジトリと並んでワークツリーディレクトリがあると、理由あってワー

k1LoW 2026/01/23

“これは完全にアイデアの勝利” 本当にそう。導入ありがとうございます！

リンク

Remotion | Make videos programmatically

Make videos programmatically.Create real MP4 videos with React. Parametrize content, render server-side and build applications.

k1LoW 2026/01/22

リンク

TX-02 Berkeley Mono™ Typeface

TypefaceTX-02 Berkeley Mono™ is a love letter to the golden era of computing. The era that gave rise to a generation of people who celebrated automation and reveled in the joy of computing, when transistors replaced cogs, and machine-readable typefaces were developed, for when humans and machines truly interfaced on an unprecedented scale. It wears a UNIX T-shirt and aspires to be etched on contro

k1LoW 2026/01/20

リンク

AeroSpaceでtagベースなworkspace管理をする

会社で支給されたMacで開発をしないといけない状況があって、どうにかLinuxでの操作感に近づけないかとAIに相談したところ AeroSpace AutoRaise JankyBorders でかなり近い環境をつくれますよ！ということだったので試してみたところ、うーん、ないよりはマシだが、なかなか厳しいな…というのが正直なところだった。 AeroSpaceとは macOS用のタイル型Window Manager。過去にもいくつか似たようなものを試したことがあるんだけど、その中では一番筋が良いと感じる。というのも、他のものはMac自体のworkspace管理と連携するように作られていて、そもそもその時点でマインドセットがおいつかない、というか理解がむずかしく、結果うまくつかえない、ということになっていた。 AeroSpaceはその点まったくそれに依存していなくて、Macの中では一つのデスク

k1LoW 2026/01/12

リンク

https://learning.acm.org/bytecast/ep78-russ-cox

k1LoW 2025/12/20

リンク

runn で Web API のリグレッションテストをする

それではさっそくテストしていきましょう。 1. サンプルアプリまずはテスト対象のアプリケーションです。 GET /tasks というエンドポイントを用意しました。タスク情報を返します。 package main import "github.com/gofiber/fiber/v2" func main() { app := fiber.New() app.Get("/tasks", func(c *fiber.Ctx) error { tasks := []struct { Title string `json:"title"` }{ {Title: "買い物に行く"}, {Title: "ジョギングをする"}, } return c.JSON(tasks) }) if err := app.Listen(":3000"); err != nil { panic(err) } } $

k1LoW 2025/12/11

file()とcompare()の使い方が参考になる。ありがとうございます！

リンク

xUTPによるテストダブルの定義とその図解 - NTT docomo Business Engineers' Blog

この記事は、NTT docomo Business Advent Calendar 2025 8日目の記事です。自動テストの文脈で、モックやスタブという用語を目にすることがあるかと思います。この用語は、人やテストフレームワークごとに異なった意味で使われることがあり、しばしば混乱を招いています。そして、そのような指摘をした上で概念の整理を図ったものとしてGerard Meszarosの書籍『xUnit Test Patterns』（xUTP）1とウェブサイト2があります。 xUTPでは、テスト対象（SUT）の依存コンポーネント（DOC）を置き換えるものを総称して「テストダブル」と呼び、その目的に応じて以下の種類に分類しています。モックスタブフェイクスパイ (ダミー) このxUTPによるテストダブルの分類については、日本語での素晴らしい解説記事がすでにいくつか存在しますが、私が社内で

k1LoW 2025/12/09

リンク

はてなブックマーク

タグ

k1LoWのブックマーク (5,250)

お知らせ

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス