タグ

関連タグで絞り込む (195)

タグの絞り込みを解除

aiに関するkiririmodeのブックマーク (372)

  • 人間レビューはもう不要? AI と人間のレビューの線引きを決めた話

    はじめに こんにちは!Acsim 開発チームの笹沢です。 AI 駆動開発の浸透でコードの生産量は飛躍的に増えました。一方、人間がレビューに割ける時間は変わらないため、レビュー待ちで PR がスタックする場面が以前より増えていきました。 私たちのチームでは「人間のレビューを必須とするもの」と「AI レビューで OK とするもの」を線引きし、セルフマージ制度として日々の開発に組み込みました。直近では PR の 約 8 割が人間レビューを介さずにマージできています。マージまでのリードタイムも短縮されています。 この記事では、セルフマージ制度の設計と運用上の工夫、導入後の変化を紹介します。AI レビューが十分使えるレベルになった今、自チームのレビュー運用を見直したい方の参考になれば嬉しいです。 すべての PR に人間レビューは必要か 最近の AI レビューはコード品質の担保という意味では十分使える

    人間レビューはもう不要? AI と人間のレビューの線引きを決めた話
    kiririmode
    kiririmode 2026/05/04
    AI 時代のレビューは、人間がすべてを承認する仕組みから、不可逆な判断だけを人間が担い、戻せる変更は AI レビューとセルフマージで高速に流す仕組みへ変えるべきと言う話
  • 品質の言語化のススメー早期テストの原則をClaude Code Agent Skillsで実現する試み - LayerX エンジニアブログ

    LayerX QAエンジニアの小山です。 昨今、AIコーディングアシスタント(特にClaude Code等)の進化により、コードの実装やテスト追加のスピードが飛躍的に向上しています。しかし、AIにコードを書かせる際に「どこまで厳密なエラーハンドリングが必要か」「テストはどの程度書くべきか」といったことに迷われた経験はないでしょうか? 今回は、バクラク事業部の品質の定義やテスト戦略などを言語化し、Claude Codeが動く際にリスクの高い箇所を守るように動いてもらい、テストも同時に生成してもらう、早期テストで時間とコストを節約する試みについてご紹介します。 ソフトウェアテストの原則「早期テストで時間とコストを節約する」 筆者はJSTQB FLの公認コースのトレーナーを15年ほどしているのですが、JSTQB FLシラバスの中に「テストの原則」として7つの原則があります。その中の1つとして「早

    品質の言語化のススメー早期テストの原則をClaude Code Agent Skillsで実現する試み - LayerX エンジニアブログ
    kiririmode
    kiririmode 2026/05/04
    AIが速くコードを書く時代に品質を守るために必要なのは、AIに丸投げすることではなく、人間が品質・リスク・テスト責務を言語化し、AIが開発初期からそれを適用できる仕組みにすること
  • AI駆動開発で、なぜミドルエンジニアは不安になるのか ── AIによる分業の終わりと始まり - arclamp

    AI駆動開発が「使える」となってきたことで、20代後半から30代中盤のミドルエンジニアが疲弊しているという話を聞きました。たしかに、エンジニアの中でも「AIは楽しい・これでもっと良くなる」という意見と「不安だ・これからどうなるのだろう」という意見に分かれているようです。 私の周りでは、特にベテランが楽しんで、ミドルが不安になっているような構図を感じています。 この記事では、システム開発における30年間の分業と統合の歴史を振り返りつつ、それぞれの世代が何を経験してきたのかを整理します。そのうえで、AI駆動開発が既存の分業をどのように統合しようとしているのかを見ていきます。そして、これがベテランとミドルの違いに、どのように影響しているのかを考えます。 最後には、AI駆動開発が「分業の終わり」ではなく、AIを前提にした「新たな分業の始まり」でもある、という見方を提示します。 この30年の歴史を振

    AI駆動開発で、なぜミドルエンジニアは不安になるのか ── AIによる分業の終わりと始まり - arclamp
    kiririmode
    kiririmode 2026/05/04
    AI駆動開発は専門分業の終焉でなく、AIを前提に「何をAIに任せ何を人間が担い境界をどう設計するか」という新しい分業を始める変化。ミドルの不安は、自分の存在価値を支えてきた専門領域がAIに直接触れられるから生じ
  • Compound Engineering

    kiririmode
    kiririmode 2026/05/04
    開発のたびに得た知見をエージェント・ドキュメント・レビュー観点・ワークフローへ還元し次の開発を高速/安全/高品質にする開発思想。AI時代のエンジニアは良いコードが継続的に生まれる仕組みを設計改善し続ける人
  • Graphify — Knowledge Graph Skill for AI Coding Assistants

    kiririmode
    kiririmode 2026/05/03
    AIコーディングアシスタントにリポジトリを雑に読ませるのではなく、AST含め事前に構造地図を作って、必要な依存関係・設計意図・関連ファイルだけを辿らせるための前処理ツール
  • Gemma 4をローカルで動かす ── PLE・量子化・TCO計算まで踏み込む実践ガイド - Qiita

    2026年4月2日、Google DeepMindがGemma 4をApache 2.0ライセンスで公開しました。E2B、E4B、26B MoE、31B Denseの4サイズ展開で、スマートフォンからワークステーションまでカバーします。 Reddit r/LocalLLaMAでは公開直後から大きな反響があり、Arena(旧LMSYS Chatbot Arena)のテキストリーダーボードでは31Bがオープンモデル3位(ELO 1,452)、26B MoEが6位にランクインしています。 この記事では、Gemma 4の技術的な特徴を掘り下げたうえで、手元のデバイスで動かすための具体的な手順を整理します。 Gemma 4の技術的な強み Apache 2.0ライセンス 商用利用・改変・再配布が自由なApache 2.0を採用しています。LlamaやMistralのカスタムライセンスと異なり、企業での

    Gemma 4をローカルで動かす ── PLE・量子化・TCO計算まで踏み込む実践ガイド - Qiita
    kiririmode
    kiririmode 2026/04/26
    Gemma 4はPLEによる軽量化、量子化、AL2ライセンスによってローカルLLMを実務で使える選択肢に近づけた。ただしAPIの全面代替ではなく、機密データ処理・オフライン利用・反復タスクのTCOに向いた補完手段として捉えるべき
  • Spec-driven development with AI: Get started with a new open source toolkit

    AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be

    Spec-driven development with AI: Get started with a new open source toolkit
    kiririmode
    kiririmode 2026/04/20
    SDDはvibeの無秩序性に対し短く有効なFBループを成立させる仕組み。AIのspec driftやハルシネーションを受け入れず、仕様/制約/構造化入力/CI/CDによって制御可能な形に圧縮し完全制御ではなく制御可能性を上げる中間層の位置
  • Comprehension Debt: The Hidden Cost of AI-Generated Code

    The following article originally appeared on Addy Osmani’s blog site and is being reposted here with the author’s permission. Comprehension debt is the hidden cost to human intelligence and memory resulting from excessive reliance on AI and automation. For engineers, it applies most to agentic engineering. There’s a cost that doesn’t show up in your velocity metrics when teams go deep on AI coding

    Comprehension Debt: The Hidden Cost of AI-Generated Code
    kiririmode
    kiririmode 2026/04/19
    理解負債はシステムの理解が人から失われる状態。正しい仕様記述は存在せずテストは想像外の失敗を検証できないのでこれらで置換は困難。論点は速く作れるかではなく、人の理解を維持したまま出荷可能か
  • Can analysis ever be automated?

    kiririmode
    kiririmode 2026/04/19
    分析業務の難所は、分析を作ることではなくその正しさの検証。AIによる分析は検証しないと危険だが、厳密に検証すると自動化のうまみが消えるため、分析の実用性は「誰がそれを信じるのか」という信頼構造に依存する
  • How AI will Disrupt BI As We Know It

    Credit: DALL-EBusiness intelligence is on a collision course with AI. The collision itself hasn’t happened yet, but it’s clearly coming. The inevitability of this has been clear roughly since the launch of ChatGPT, but no one knew exactly what shape that would take. Today I want to propose how that collision is going to happen and what will happen in its aftermath. I think it will be a very good t

    How AI will Disrupt BI As We Know It
    kiririmode
    kiririmode 2026/04/19
    AIによってBIの中核だったEDAが外部化され、BIは“分析する場所”から“分析結果を運用可能にする場所”へ役割転換を迫られ、ガバナンスと共有の基盤へと後退・再編されるのではないかという主張
  • AIエージェントのHuman-in-the-Loop評価を深化させる - LayerX エンジニアブログ

    宣伝 LayerXでは2026/04/11~26開催の技術書典20でLayerX TeckBook 2を発売します。そちらにも記事を寄稿していますので、もし良ければご一読いただけると幸いです。 techbookfest.org はじめに LayerX Ai Workforce事業部R&Dチームマネージャーの澁井(しぶい)と申します。 記事はAIエージェントのHuman-in-the-loopを定量評価するための手法やビジネス価値を検討します。 AIエージェントによる業務効率化やソフトウェア開発自動化が進むに従って、AIエージェントのアウトプットを人間が確認してアクションすることが増えていると思います。こうしたAIエージェントに対する人間の確認や行動、承認をHuman-in-the-loopと言います。 Human-in-the-loop(以下HITL)はAIエージェントを安定稼働させるた

    AIエージェントのHuman-in-the-Loop評価を深化させる - LayerX エンジニアブログ
  • Claude Codeに社内の情報を集約させたら、要求分析の立ち上げがスムーズに回り始めた - KAKEHASHI Tech Blog

    こんにちは、認証・権限管理基盤チームの五十嵐です。 直近のプロジェクトで、Claude Codeに既存のコードベース・Slack・社内ドキュメント(Confluence)を読み込ませ、要求分析の叩き台を生成するという取り組みを行いました。 今回はその具体的な進め方と結果を共有します! 背景と課題 私が所属していたチームは2026年01月に認証・権限基盤チームに統合となり、統合先のメンバーと一緒に働くことになりました。 直近の新しいプロジェクトで、エンジニア主導で要求分析を行おうと試みましたが下記のような課題がありました。 メンバー全員が既存システムに詳しいわけではない 既存システムの業務知識がコードに暗黙的に埋まっていたり、ドキュメント化されていないものがある どの手法で要求分析を進めるか判断が必要だった アプローチ:Claude Codeに社内の情報を集約させる 何を読ませたか Clau

    Claude Codeに社内の情報を集約させたら、要求分析の立ち上げがスムーズに回り始めた - KAKEHASHI Tech Blog
    kiririmode
    kiririmode 2026/04/09
    RDRAへのAI適用。コード・社内文書を集約し、データ構造:状態遷移/関連フロー等を整理し要求分析の叩き台は作れる。暗黙知、業務的意図、要求やユースケースの粒度、現場運用とのずれは苦手、人間のレビューと補完が前
  • 要件定義手法RDRAの概要と全体像 - TRACERY Lab.(トレラボ)

    シリーズ: モデルベース要件定義手法RDRA 要件定義手法RDRAの概要と全体像(記事) RDRAによる要件定義の進め方〜フェーズ1:枠組みを作る(近日公開予定) RDRAによる要件定義の進め方〜フェーズ2:要件を組み立てる(近日公開予定) RDRAによる要件定義の進め方〜フェーズ3:整合性・網羅性を確認し精度を上げる(近日公開予定) RDRAの成果物と設計フェーズとの連携(近日公開予定) RDRA Agentの紹介(近日公開予定) RDRAと見積(近日公開予定) TRACERYプロダクトマネージャーの haru です。 要件定義は、システム開発の成否を左右する重要なプロセスです。しかし実務では、一定のフォーマットや手順に沿って整理していても、要件同士の関係性が十分に可視化されなかったり、関係者ごとに解釈がずれたり、設計段階で手戻りが発生したりと、多くの課題が生じがちです。 筆者は202

    要件定義手法RDRAの概要と全体像 - TRACERY Lab.(トレラボ)
    kiririmode
    kiririmode 2026/04/09
    RDRA概観。支援ツールはいくつかあるっぽい
  • RDRA

    (R)elationship  (D)riven  (R)equirement  (A)nalysis Supported by (株)バリューソース RDRA(ラドラ)はモデルベースのビジネスとシステムの可視化手法です To-Beに向けると要件定義に使え、As-Isで活用すると既存システムの可視化に使えます

    RDRA
    kiririmode
    kiririmode 2026/04/09
    要件を「価値・業務・システム境界・内部構造」のレイヤーに分け、相互の関係を構造として表す要件定義手法RDRA。要件をモデルとして扱うため、抜け漏れや矛盾を検証しやすく、基本設計にも意図を伝承しやすい。
  • https://x.com/pkm_tk111/status/2041173931126816770?s=12&t=8snO90Ee0V5u8yV3LK7zwA

    kiririmode
    kiririmode 2026/04/09
    LLM Wikiは知識を蓄積・統合し続けるwikiを中心に据え、AIに保守と更新を担わせる一方、Obsidianを人間が自分の言葉で考える場と捉え、その純度を守るためにAI生成wikiを裏側へ隔離。知識管理中心か、人間の思考中心か。
  • llm-wiki

    llm-wiki.md LLM Wiki A pattern for building personal knowledge bases using LLMs. This is an idea file, it is designed to be copy pasted to your own LLM Agent (e.g. OpenAI Codex, Claude Code, OpenCode / Pi, or etc.). Its goal is to communicate the high level idea, but your agent will build out the specifics in collaboration with you. The core idea Most people's experience with LLMs and documents lo

    llm-wiki
    kiririmode
    kiririmode 2026/04/09
    従来は文書を集めても知識が蓄積されず、質問のたびにRAG的に再検索・再構成が必要で矛盾整理や更新保守も人手負担。Obsidian上のwikiをLLMが継続的に更新し、要約・相互参照・矛盾反映を担うことで、知識を永続的に育てる
  • 全PRの83%をAIレビューだけでマージできるようにした

    はじめに カウシェでは、PRの83%が人間のコードレビューを経ずに自動でマージされています。 GitHub Actions上で動くAIレビュー(Claude Code Action)がPRを自動でApproveし、CIが通ればそのまま自動マージされる仕組みです。 記事では、レビュールールを毎晩自動改善する仕組みを作ることで、自分たちの運用で許容できるレベルまでAIレビューの精度を引き上げた話を書きます。 これが成り立つ前提 カウシェはtoCのECプラットフォームで、バックエンド・フロントエンド・モバイルを1つのモノレポで開発しています。 決済や認証など不可逆な領域は人間がレビューしていますが、それ以外は万一バグが出ても迅速にロールバックや修正デプロイで対応できるので、auto-mergeという選択肢が取りやすい環境です。 その上で、83%の自動マージはAIレビューの精度だけで成り立ってい

    全PRの83%をAIレビューだけでマージできるようにした
    kiririmode
    kiririmode 2026/04/09
    E2EテストとCIで品質の土台を先に固めたうえで、決済・認証・DB変更など影響が大きい領域だけは人間レビューに残し、それ以外はAIレビュー+自動マージ。見逃しやノイズを毎晩計測し、ルールを追加・整理する改善ループ
  • AI効率化と意思決定のしんどさ - しゅみは人間の分析です

    手を動かす仕事が減っている いまソフトウェアエンジニア業界ではAI(主にClaude Code)のおかげで仕事が効率化されていっている。簡単なコードを書く業務はかなり減っていて、誰が書いても同じになるよね?というコードはAIにプロンプトを投げるだけで思っていたとおりのものが出てくる。とても便利だ。もちろん何も考えずにすべてをAIに任せられるということはなくて、良い結果を得るためにはプロンプトをよく練る必要がある。また、何度もダメ出しをして細かいフィードバックを重ねるのも大事だ。便利ではあるが、良くも悪くもAIを操縦する人の腕前で成果が大きく変わる。 意思決定の連続 なにがしんどいのか。頭をフル回転させなければならない時間が増えてしまったところ。これまでのソフトウェア開発では、最初の設計や方針検討のタイミングで深く考え、そのあとは手を動かしながらゆる〜く頭を使うことが多かった。設計ミスやバグ

    AI効率化と意思決定のしんどさ - しゅみは人間の分析です
    kiririmode
    kiririmode 2026/04/08
    頭脳労働の密度が上がる、労働強度が上がる。これが高度化ということだとも思うし、それに追随しないと競争力が保てないとも思うが、思考の体力をつけるのはしんどいよね。。。
  • https://x.com/ikeda_haruki_/status/2039905455280165184?s=12&t=8snO90Ee0V5u8yV3LK7zwA

    kiririmode
    kiririmode 2026/04/05
    aiで見た目を作らせる前にストーリー構成を設計しろという話
  • GitHub - abhigyanpatwari/GitNexus: GitNexus: The Zero-Server Code Intelligence Engine - GitNexus is a client-side knowledge graph creator that runs entirely in your browser. Drop in a GitHub repo or ZIP file, and get an interactive knowledge graph wit a b

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - abhigyanpatwari/GitNexus: GitNexus: The Zero-Server Code Intelligence Engine - GitNexus is a client-side knowledge graph creator that runs entirely in your browser. Drop in a GitHub repo or ZIP file, and get an interactive knowledge graph wit a b
    kiririmode
    kiririmode 2026/04/05
    大規模コードをtree-sitterなどで解析しコードの関係性をgraphragに格納、mcpやskillでコーディングエージェントに渡すことで実装・改修等を効率化する