WSOHのブックマーク (1,407)

  • 既存ソースコードからAgent Skills を抽出作成する

    はじめに Agent Skills、すごい便利ですよね。皆様はAgent Skills お使いでしょうか。 私は他力願なので、最近は開発作業も含め、なんでもAI Agentに任せて実施させたいと考えてしまいます。 AI駆動開発といえば、新規の開発案件が得意領域な印象ですが、古今東西の開発プロジェクトは、新規開発!刷新開発!イケイケどんどん開発!という案件ばかりではなく、 コストなどのやんごとなき事情により、既存ソースコードをベースにしつつモダナイズ、という方向の案件もまだまだ存在します。 そのほうがストーリー的に通しやすい点も痛いほどわかります。 しかしながら、いざいざ既存コードベースの案件が開始となると、既存コードの解読という、百歩譲って、、いや、百万歩ぐらい譲って、控えめな地獄、がありまして。 そんななか、 「既存コードからこのプロジェクト特有のコーディングなどをAgent Akil

    既存ソースコードからAgent Skills を抽出作成する
  • SKILL.md AGENTS.md AgentSkills 完全整理ノート(備忘録)

    エグゼクティブサマリー この記事は、AIコーディングツールまわりで増えがちな AGENTS.md、CLAUDE.md、GEMINI.md、SKILL.md、agents系ファイルをどう分けるか、という話です。 結論はかなりシンプルで、「常に読ませるもの」「必要なときだけ読ませるもの」「役割を持つ別エージェント」を分けると扱いやすいです。 AGENTS.md を共通ルールの正にしつつ、ツール固有ファイルは薄くし、手順は SKILL.md、役割分担は agents系ファイルに逃がす、という点です。 今回のキーメッセージはこれです。 常時ルールは AGENTS.md ツール固有の入口は薄くする 手順は SKILL.md 役割分担は agents系ファイル 結論 まずは、この理解で十分かなと思います。 書くもの 一言でいうと 向いている内容

    SKILL.md AGENTS.md AgentSkills 完全整理ノート(備忘録)
  • 【特別対談】「ウィザードリィ」を遊びたくなるーー 『ブレバス』蝸牛くも×『ロードス島戦記』水野良がゲーム遍歴を語り尽くす

    「ウィザードリィ」との出会いは? ――2010年代にデビューされた蝸牛さんの作品は、80年代に水野さんたちが作り上げた和製ファンタジーの世界観を、文脈的に多々受け継いでいるところがあると思います。お二人は、これまでに面識はあったのでしょうか? 水野良(以下、水野):お会いするのは初めてですね。ただ、グループSNEとお仕事をしておられるので、御活躍はよく存じておりました。 蝸牛くも(以下、蝸牛):はい、グループSNEさんには、『ゴブリンスレイヤーTRPG』でお世話になりました。小学生の頃に『ロードス島戦記』を読んだのですけれど、その頃の自分は、まさかお会いできる日がくるとは思っていなかったので、当に光栄です。 水野:小学生ですか。それは嬉しいですね。 ──年齢も、デビュー時期も、世代が大きく異なるお二人ですが、どちらもゲーム文化が背景のファンタジー作品でデビューされたという共通点があります

    【特別対談】「ウィザードリィ」を遊びたくなるーー 『ブレバス』蝸牛くも×『ロードス島戦記』水野良がゲーム遍歴を語り尽くす
  • 品質の言語化のススメー早期テストの原則をClaude Code Agent Skillsで実現する試み - LayerX エンジニアブログ

    LayerX QAエンジニアの小山です。 昨今、AIコーディングアシスタント(特にClaude Code等)の進化により、コードの実装やテスト追加のスピードが飛躍的に向上しています。しかし、AIにコードを書かせる際に「どこまで厳密なエラーハンドリングが必要か」「テストはどの程度書くべきか」といったことに迷われた経験はないでしょうか? 今回は、バクラク事業部の品質の定義やテスト戦略などを言語化し、Claude Codeが動く際にリスクの高い箇所を守るように動いてもらい、テストも同時に生成してもらう、早期テストで時間とコストを節約する試みについてご紹介します。 ソフトウェアテストの原則「早期テストで時間とコストを節約する」 筆者はJSTQB FLの公認コースのトレーナーを15年ほどしているのですが、JSTQB FLシラバスの中に「テストの原則」として7つの原則があります。その中の1つとして「早

    品質の言語化のススメー早期テストの原則をClaude Code Agent Skillsで実現する試み - LayerX エンジニアブログ
  • https://x.com/MrBeast/status/2049273335742435617 地球上の誰もが、赤いボタンか青いボ..

    https://x.com/MrBeast/status/2049273335742435617 地球上の誰もが、赤いボタンか青いボタンを押して秘密の投票を行います。50%以上の人が青いボタンを押した場合、誰もが生き延びます。50%未満の人が青いボタンを押した場合、赤いボタンを押した人だけが生き延びます。あなたはどのボタンを押しますか? 正直に。 赤 44% 青 56% 「赤を押せば確実に生き残れるのに、不思議」 という人がいるが、赤を押して生き残った場合、その世界は 「自分が生き延びさえすれば他人は死んでもよい」 と考える人だけで構成されていることになる 地獄では

    https://x.com/MrBeast/status/2049273335742435617 地球上の誰もが、赤いボタンか青いボ..
    WSOH
    WSOH 2026/05/02
    この問題をシンプルに書くと「青のボタンを押した人は、青のボタンを押した人が50%未満なら死にます。」だけ。自殺志願者でも無い限り青のボタンを押す理由は無い。利他利己の話ですらない。
  • セキュリティ診断、AIに全部やらせたら月$0.5で回せるようになった話💰

    📢 アップデート版を公開しました(2026/05/01) この記事のあと、3スキル体制に分割 + テストハーネスで検出率100%を達成 しました。最新の使い方は以下の記事をどうぞ。 👉 claude-security-scanを3スキル体制にアップデートしたら月$1未満で検出率100%を達成した話🎯 はじめに こんにちは、Sabakanです。 今回、Claude Code 用のセキュリティ診断スキル claude-security-scan を作って公開しました。 正直、自分でもびっくりするくらい実用的なものができたので、紹介させてください。 リポジトリはこちら → https://github.com/sabakan0123/claude-security-scan こんな気持ち、ありませんか? 「セキュリティ診断、ちゃんとやりたいけど Burp Suite の使い方よくわからん」

    セキュリティ診断、AIに全部やらせたら月$0.5で回せるようになった話💰
  • 実はここまでできるCoworkハンズオン — Claude Codeに行く、その前に を経て|まつにぃ

    なぜ「Claude Codeに行く、その前に」なのかClaude Codeは、とても強力なエージェントツールです。ローカルファイルを編集でき、コマンドを実行でき、Git操作やMCP連携まで扱えます。実際、開発寄りの業務に限らず、あらゆる業務に適用できるエージェントツールの最有力な選択肢になってきています。 ただし、強い権限を持つツールは、そのまま業務に入れると、考えておくべきことも増えます。どのファイルまで触ってよいのか、社外秘情報や顧客情報をどう扱うのか、意図しない変更が起きたときにどう説明するのか。特に非エンジニアを含む組織展開では、便利さだけではなく、権限設定や運用の説明が必要になります。 今回あえて「Claude Codeに行く、その前に」と置いたのは、Code系のツールを否定したいからではありません。 むしろ逆で、強力なツールに進む前に、まずはAIと一緒に業務を進め、どこまで任せ

    実はここまでできるCoworkハンズオン — Claude Codeに行く、その前に を経て|まつにぃ
  • Anthropicはなぜ異次元の速度で開発できるのか|すてぃお

    「Anthropic(Claudeを作っている会社)、開発が速すぎる」 最近、周りのエンジニアと話していると、この話題がよく出ます。僕も同じことを思っていて、いろいろ調べているうちに、単に「AIを使っているから速い」という一言では説明できない構造があることが見えてきました。 例えば、下記になります。 2026年Q1の3ヶ月で120以上の機能をリリース(18時間に1機能) エンジニア1人あたり1日約5PR(Pull Request、コードの変更を提出する単位) 社内では毎日60〜100回のリリース Claude Coworkは約10日で構築 Claude DesignはOpus 4.7のリリース翌日に公開 普通のソフトウェア開発企業の感覚からすると、明らかに異次元です。この記事では、公開されているインタビューや内部研究、関係者の発言をもとに、「なぜこんなことが可能なのか」というのを調べた限り

    Anthropicはなぜ異次元の速度で開発できるのか|すてぃお
  • 人間レビューはもう不要? AI と人間のレビューの線引きを決めた話

    はじめに こんにちは!Acsim 開発チームの笹沢です。 AI 駆動開発の浸透でコードの生産量は飛躍的に増えました。一方、人間がレビューに割ける時間は変わらないため、レビュー待ちで PR がスタックする場面が以前より増えていきました。 私たちのチームでは「人間のレビューを必須とするもの」と「AI レビューで OK とするもの」を線引きし、セルフマージ制度として日々の開発に組み込みました。直近では PR の 約 8 割が人間レビューを介さずにマージできています。マージまでのリードタイムも短縮されています。 この記事では、セルフマージ制度の設計と運用上の工夫、導入後の変化を紹介します。AI レビューが十分使えるレベルになった今、自チームのレビュー運用を見直したい方の参考になれば嬉しいです。 すべての PR に人間レビューは必要か 最近の AI レビューはコード品質の担保という意味では十分使える

    人間レビューはもう不要? AI と人間のレビューの線引きを決めた話
  • PMP(Project Management Professional)を取ろうとしている人に読んでほしい、PMPの話

    こんにちは アクセンチュア北海道オフィス所属の唐津です。 1年ほど前にPMPを取得しました。取得して意味あったな~というのと、最近周りでPMPを取ろうとしている人がいるので、「攻略法」と「取得する意味」を改めて言語化しようと思った次第です。 ただし具体の勉強法(この参考書が役にたった、こういう学習Cycleが良かった)とかは書いてないのであしからず。 この記事は、これからPMPを取ろうとしている人たち、そしていま勉強中で「この量、当に全部覚えるの…?」と手が止まりかけている人に向けて書いています。受験してから読む記事ではなく、受験準備のど真ん中で読んでほしい記事です。 私自身、PMPを受ける前は学習の範囲が広すぎて胃もたれしそうでしたが結局のところ、 PMPは、暗記で受かる試験ではなかった。世界観の理解で受かる試験。 問題集を周回していたときには見えなかった景色が、「あ、そういうことか」

    PMP(Project Management Professional)を取ろうとしている人に読んでほしい、PMPの話
  • 数字は「嘘をつける」──KPIがチームの協力を破壊する構造的な理由 | サイボウズ式

    話題の人気ブログ「おい、」シリーズの著者で、ソフトウェアエンジニアのnwiizoさんによる新連載「生産性を取り戻せ」が始まります。この連載では「仕事の生産性」をあらゆる角度からとらえ、チームで生産性を高めていくためのヒントを探っていきます。 第2回のテーマは「なぜKPIを達成しているのに、チームの生産性は壊れるのか?」です。生産性を「計測」するという行為は、一見理にかなっているように見えますが、実は生産性を壊す「脅威」でもあります。 はじめに 2週間に一度の振り返りミーティング──スプリントレトロスペクティブと呼ばれる場の午後だった。 チームの作業量を示す数字が、2回連続で下がっていた。この数字はベロシティと呼ばれ、タスクごとに振られたポイントの合計で表される。 マネージャーがグラフを画面共有した。右肩下がりの折れ線。「なぜベロシティが落ちたのか、チームで話し合いたい」。全員がカメラの前で

    数字は「嘘をつける」──KPIがチームの協力を破壊する構造的な理由 | サイボウズ式
  • 実装コストが下がった今、エンジニアの仕事はどう変わるか

    はじめに この記事は、先日Rehab for JAPANのエンジニア月次定例で話した内容の外向け版です。社内向けに用意したスライドをもとに、要旨をあらためて整理し直しました。 テーマは「これからのITエンジニア」。AIコーディングが実務で使えるものになってきた今、エンジニア仕事は「コードを書く人」から「AIとプロダクトを動かし、成果に責任を持つ人」へと、少しずつ移り始めているのではないか、という話です。 話しながら、自分自身にも同じ問いを投げかけているような感覚がありました。「このままの働き方でいいのか」を、個人と組織の両方に置いてみた、という位置付けに近いと思います。似たような迷いのなかにいるエンジニアやテックリード、EM、CTOの方に、少しでも参考になればと思い公開することにしました。やや長めですが、気が向いたタイミングで読んでもらえればと思います。 AIコーディングは、もう「補助」

    実装コストが下がった今、エンジニアの仕事はどう変わるか
  • ボトルネックは「人と人の間」に移動する──TOC(制約理論)の限界と絡み合った組織への適応 - Agile Journey

    ボトルネックを見つけて解消する。それで問題は解決するはずでした。 しかし実際には、別の場所にボトルネックが現れ続けます。その繰り返しの中で、問題はやがてコードや工程ではなく、「人と人の間」に移っていく。 TOC(制約理論)の考え方から出発し、複雑な組織における問題の捉え方と、「視点を動かす」という立ち振る舞いを掘り下げます。 ボトルネックを見つけたい ボトルネックが移動する 問題の種類が違う──工場から熱帯雨林へ 複雑な現場でどうするか──着眼大局、着手小局 分解した瞬間に壊れるもの 信頼貯金を育てる おわりに──視点を動かす 信頼貯金で変化に対応する ボトルネックを見つけたい 予算が足りない。時間がない。その割にやることが多過ぎる。 開発の現場で日々直面するこうした問題には、ある共通点があります。問題が「見えている」ということです。誰が見ても「ここが詰まっている」と分かる。テストが手作業

    ボトルネックは「人と人の間」に移動する──TOC(制約理論)の限界と絡み合った組織への適応 - Agile Journey
  • Claude Codeで開発を自動化するSkills 5選 - Qiita

    「Claude Codeを使い始めたけど、毎回同じような指示をプロンプトに書いている気がする…」と感じていませんか? Claude Codeは素のままでも強力ですが、Skillsを使うことで繰り返しの作業を自動化し、開発のルーティンをまるごとコマンド一発に変えることができます。この記事では、開発の自動化に特に役立つSkills 5選を、具体的な使いどころとともに紹介します。 「毎回同じプロンプトを書くのが面倒」「チームの開発フローを統一したい」と感じているエンジニアに、特に読んでほしい内容です。 結論:Skillsは「賢いマクロ」ではなく「文脈を持った自動化」 一般的なマクロやシェルスクリプトは、決められた手順を機械的に繰り返すだけです。でも Claude Code の Skills は違います。プロジェクトのコンテキストを理解した上で、状況に応じた判断をしながら自動化を実行してくれます。

    Claude Codeで開発を自動化するSkills 5選 - Qiita
  • AI 駆動の業務変革手法 :「課題は何ですか?」と聞くのをやめた日 | Amazon Web Services

    提案を始めると、生成 AI による成果物作成の高速化と意思決定への集中に期待の声をいただき、一定の効果も実感いただけました。その一方で、見逃せない反応もいくつかありました。 AI エージェントに業務を任せるのは、BCP の観点で危険である。我々のビジネスは止まることが許されない AI BPR を実施してみたが、予想した解決策の枠内にとどまった。これまでの検討に比べて大きな進歩を感じない いずれも正当な主張に思えます。しかし、事業継続性については人間にプロセスを残しても体調不良や欠勤によるリスクがあります。止まることが許されないならばAI エージェントの活用は合理的なはずです。後者は、課題と解決策について常日頃考えている担当者であれば妥当な評価です。一方、生成 AI の提案を批評家目線でとらえて共創相手として扱っていない点が気がかりでした。 表面的なフィードバックは多様ですが、深層に共

  • 「ソーシャルエンジニアリング」の裏側を暴く5冊。技術が進歩しても、騙しの構造は変わらない【IPUSIRON】|レバテックLAB - レバテックLAB

    IPUSIRON(イプシロン) 1979年福島県相馬市生まれ。相馬市在住。タイトルにある「ミジンコ」は、サインに添えて素早く描けるシンプルなイラストとして採用したものであり、同時に「常に初心を忘れない」という自戒も込めている。2001年に『ハッカーの教科書』(データハウス)を上梓。情報・物理的・人的の観点から総合的にセキュリティを研究しつつ、執筆を中心に活動中。その集大成として2026年1月に『サイバー忍者入門』(翔泳社)を刊行。主な著書に『ハッキング・ラボのつくりかた 完全版』『暗号技術のすべて』(翔泳社)、『ホワイトハッカーの教科書』(C&R研究所)などがある。 X:@ipusiron GitHub:ipusiron ブログ:Security Akademeia 著書『暗号技術のすべて』 著書『ハッキング・ラボのつくりかた 完全版』 著者記事一覧 はじめに 連載「ミジンコの読書案内」

    「ソーシャルエンジニアリング」の裏側を暴く5冊。技術が進歩しても、騙しの構造は変わらない【IPUSIRON】|レバテックLAB - レバテックLAB
  • 【情シス目線】Claude Team を複数社に導入して気づいたこと|kaze

    業や副業で Claude Team を導入する機会があったので、初期設定や使い方、SSO・監査ログの注意点など、法人利用で押さえておくべきポイントを情シス目線でまとめています。Claude Console や Pro/Max からの移行を検討している方にも参考になれば。 この記事でわかること(忙しい人向け)法人利用は Pro/Max より Team か Enterprise にすべき理由 導入直後に情シスがやるべき 追加使用量・SSO の設定 監査ログ が必要かどうかで Team と Enterprise を使い分ける判断基準 社内に周知すべき モデルの選び方 チャット・Cowork・Claude Code の 使い分け はじめに:どのプランを選ぶべきかClaude には Free・Pro・Max・Team・Enterprise と複数のプランがあります。各プランの違いについては世の中に

    【情シス目線】Claude Team を複数社に導入して気づいたこと|kaze
  • プロンプトの再現性をAI に自動チューニングさせる方法 ~ 暗黙知を排除する

    AI技術記事は傷気味なんですが、さすがにこれは効くと思ったパターンを見つけたので紹介します。 tl;dr プロンプト (skill / slash command) を書いた直後は「これで伝わるはず!」と思うのに、別のセッションで使うと暗黙知が不足していて、再現性がなくなる 思い込みは当人に修正できないバイアスなので、別の AI に実際にやらせて詰まった箇所をレポートさせる これを繰り返す。プロンプトが段階的に洗練される (TDD のテストと同じ位置づけ) 実際に手元 8 個の skill で試して、初稿 50 点が (AI 主観で) 80〜90 点まで上がった。ただし、モデルを変えての評価してないので、過剰に適応している可能性はある。 自分が書いたプロンプトを評価していますか? 自分は大学時代に暗黙知の研究をしていたのだが、世の人々は主観バイアスを過小評価している。また、AIは人間

    プロンプトの再現性をAI に自動チューニングさせる方法 ~ 暗黙知を排除する
  • 1-bit LLM「Bonsai-8B」をRTX 4080に8台載せて並列推論を試した全記録

    TL;DR PrismMLの1-bit LLM「Bonsai-8B」(1.07GB) をRTX 4080 (16GB) に 8プロセス同時起動 できた 1台で260 tok/s、8台同時リクエストでも全台が2秒以内に応答 アンサンブル推論(7台で回答→1台で統合)を試したが、精度は +1.7pp でほぼ誤差 ファンアウト検索(質問分解→並列深掘り→統合)は構造化に強いがコンテキスト制約がボトルネック 「精度向上」より「1枚のGPUで8並列サービング」が当の価値 きっかけ:「アンサンブルできるのでは?」 LLMの精度を上げる手法として「複数のモデルに同じ質問を投げて多数決を取る」アンサンブル推論がある。論文では有効性が示されているが、実際に試すには同じモデルを何台も同時に動かす必要がある。 通常の8Bモデル(Q4_K_M量子化)は1台で約5GBのVRAMを使う。RTX 4080の16GBで

    1-bit LLM「Bonsai-8B」をRTX 4080に8台載せて並列推論を試した全記録
  • シニアエンジニアリングリーダーのしごと

    書は、シニアマネージャーとして成功するために必要な能力、ツール、技術について体系的に解説します。まず、シニアポジションの定義を明確にし、各ポジションが果たす役割を理解します。次に、時間とエネルギーを効率的に使い、同僚や部下、上司との共生関係を築き、有効なコミュニケーションアーキテクチャを構築するといった、さまざまなツールボックスを充実させるアイデアを紹介します。そして、組織全体の戦略の磨き方、その戦略を実現するエンジニアリング戦略や予算の効果的な使い方、好況時と不況時のリーダーシップのあり方についても考察します。 最高のリーダーとなり、自身の最終的なキャリアの目的地にたどり着くための実践可能なフィールドガイドです。

    シニアエンジニアリングリーダーのしごと