タグ

dealforestのブックマーク (9,788)

  • MSR, ICSE 2026に参加してきました|noppoman

    2026年4月12-18日の間で、ブラジル・リオデジャネイロで行われた、ICSE 2026に参加してきました。参加の最大の目的は、会議の開催日程の中で行われるMSR 2026で、論文内容の現地発表を行うことでした。 入場チケット会場の様子ICSE, MSRに関してICSEはソフトウェア工学分野最大級かつトップティアの国際会議(コアランク A*)で、ソフトウェア工学関連の研究を幅広く扱うものです。2026年度は1,469 件の論文の投稿があったようです。参加者も多様で、各国の大学、研究機関の他にも、米ビックテックや中国系のテック企業の研究者も多く参加しており、現地参加してその規模感に圧倒されました。 一方、MSRは、例年ICSEの日程内で行われる独立した国際会議で、ソフトウェア工学のうちでも、データサイエンスに特化した会議(コアランク A)です。 The Mining Software R

    MSR, ICSE 2026に参加してきました|noppoman
  • AIの見張り番をやめよう - AIチームを指揮するOSS「takt」を公開しました

    告知 実際にオーケストレーションする様子をデモしたり、使い方をお話するイベントをすることにしました! オンラインで行いますので是非お越しください! はじめに 皆さんはAIエージェントと一緒に開発をしていて、こんな経験はないでしょうか。 「さっき言ったことをもう忘れてるの?」 AIエージェントを使った開発は当に便利です。コードを書いてもらう、リファクタリングを任せる、テストを作ってもらう。素晴らしい時代になったなぁと思います。しかし、使えば使うほど、ある壁にぶつかります。 AIエージェントが、言うことを聞いてくれないのです。 与えた役割を忘れる。共有した知識が抜け落ちる。一度指摘したことを、しばらくしたらまたやらかす。皆さんにも身に覚えがあるのではないでしょうか。 私もまさにこの問題に悩まされてきました。そして、この問題を解決するために「takt」というツールを作りました。今回はその経緯と

    AIの見張り番をやめよう - AIチームを指揮するOSS「takt」を公開しました
  • gh skillが登場。GitHub公式のスキル管理ツールにnpx skillsから乗り換えた

    AIエージェント向けのスキル(Agent Skills)、みなさんはどう管理していますか? 2026/04/16、GitHub公式CLIのghに、スキルをパッケージ管理する新しいサブコマンドgh skillが追加されました。GitHubのリポジトリに公開されているスキルをgh経由でインストール・アップデート・公開できます。私はこれまでnpx skillsでスキルをインストール・管理してきましたが、gh skillの方が安全面でよさそうなので乗り換えることにしました。 記事では、メリットや実際の動作を紹介します。 3行まとめ gh skill install スキルでスキルをインストールできる gh skill publish スキルで自作スキルを仕様に沿って公開できる 改ざん検知・バージョン固定・由来情報の埋め込みなど、サプライチェーン対策が組み込み済み 環境準備 GitHub CLI

    gh skillが登場。GitHub公式のスキル管理ツールにnpx skillsから乗り換えた
  • Effective harnesses for long-running agents

    Published Nov 26, 2025 Agents still face challenges working across many context windows. We looked to human engineers for inspiration in creating a more effective harness for long-running agents. As AI agents become more capable, developers are increasingly asking them to take on complex tasks requiring work that spans hours, or even days. However, getting agents to make consistent progress across

    Effective harnesses for long-running agents
  • なぜ、Claude Codeは、RAGを捨ててAgentic Searchを選んだのか?

    先日、Claude Codeの開発者でありAnthropicのエンジニアでもあるBoris Cherny氏が、「初期のClaude CodeではRAG+ローカルベクターDBを使っていたが、最終的にAgentic Searchの方が圧倒的に良いと分かった」 という発言がありました 私はBoris氏のこの投稿を見たとき「やっぱ、そうだよな」と思いました。なぜなら私もRAGで検索システムを作った際に似たようなことを考えていたからです。この記事ではこの騒動の背景を整理しつつ、なぜClaude CodeがRAGを捨ててAgentic Searchを選んだのかを説明します。 Boris Cherny氏について Boris Cherny氏はAnthropicのエンジニアであり、Claude Codeの創設者 でもあります。また『Programming TypeScript』の著者でもあり、複数の技術系ポ

    なぜ、Claude Codeは、RAGを捨ててAgentic Searchを選んだのか?
  • ベクトル検索は不要なのか

    はじめに タイトルの問いに対して、結論から言うとベクトル検索が完全に不要になった、ということはないです。一方、「各文書を分割→ベクトル化→並列に配置して検索」のような従来RAGのアーキテクチャだと対応できないユースケースは多々あります。 記事では、従来のベクトル型RAGの特徴を振り返り、技術的課題を再認識するとともに、最新のRAGアーキテクチャの利点を踏まえて、これらとベクトル検索をいかに共存させるかを再検討します。 RAG(Retrieval-Augmented Generation) RAGの定義 そもそもRAGとは、外部にあるデータを抽出し、ユーザーの入力と合わせてLLMに入力する仕組みです。コストの重い「学習」というプロセスを経ずにLLMへ知識を追加できることが最大のメリットとなります。(ベクトル検索=RAGではない) 外部データの表現 キーワード検索 生のテキストからキーワード

    ベクトル検索は不要なのか
  • My AI Adoption Journey

    My experience adopting any meaningful tool is that I've necessarily gone through three phases: (1) a period of inefficiency (2) a period of adequacy, then finally (3) a period of workflow and life-altering discovery. In most cases, I have to force myself through phase 1 and 2 because I usually have a workflow I'm already happy and comfortable with. Adopting a tool feels like work, and I do not wan

  • AIエージェントの″ハーネス″に関わる混乱と私見

    はじめに 「Agentic Coding 生成AI時代のシステム開発入門」というを出すくらいなのでAIエージェントのハーネスには興味があって、1週間ほど調査した結果、「ハーネス」の見え方が固まりつつあるので、表題についてラフに書き留めておきます。根拠があるものないものがあるので話半分に読んでください。 スライドの形式で読みたい人はこのスライドの30Pまでくらいを読むと、記事に近い知見を得られます。 1. ハーネスという言葉への混乱 最近、AI Agent関連のドキュメントやブログで「エージェントハーネス」「ハーネスエンジニアリング」という言葉がよく出てきます。言葉がそれぞれ指す概念が曖昧かつズレている場合がちらほらあり、バズワードなのかなと感じてしまうのが最近の悩みです。 内部ハーネスと外部ハーネス コーディングエージェントユーザ視点でのmartinfowlerのハーネスの記事があって

    AIエージェントの″ハーネス″に関わる混乱と私見
  • Claude Codeはどこまで戦えるのか?Kaggle金メダルで見えた現在地

  • Claudeトークン消費を抑えて5倍使う: 「原始人」口調が80%削減

    [注意]AIに書かせた記事をそのまま私の方でレビューして掲載しています。 Claudeマーケットプレイスにだしたらまた更新するかも?よろしくおねがいします。 @追記: 2026年4月18日 Claudeのマーケットプレイスに無事公開されました🎉 genshijin@v1.3.0を公開しました。マルチエージェント対応やセキュリティ対応、ベンチマーク更新などを含めています TL;DR caveman: Claude Code向けの英語圧縮スキル。冠詞やフィラーを消してトークン約68%削減 genshijin(原始人): cavemanの日語最適化版。敬語・クッション言葉・冗長助詞を消してトークン約80%削減 cavemanよりさらに38%少ないトークンで同じ技術的内容を伝達できる なぜそんなことが可能なのか? Claudeのトークナイザと日語の言語構造に秘密がある はじめに:あなたのCl

    Claudeトークン消費を抑えて5倍使う: 「原始人」口調が80%削減
  • CarinaというTerraformライクなツールをつくりはじめた

    2026-01-24 13:47:59 +0900 きっかけ gfxさんの 個人が静的型付き言語のコンパイラをゼロから作れる時代が来た! という記事を読んで、自分も何か、以前だったらつくろうと思っても面倒で手が出なかったようなものをつくってみよう、と思ってつくりはじめた。 自分のことを知ってる方ならご存じかと思うが、自分はInfrastructure as Codeが大好きで、普段からIaCのことばかり考えている。最近だとこんなことを考えて発表した。 Terraformは好きで、公私ともにとてもお世話になっているのだが、こうなっているといいな、と思う点が色々ある。だが、Terraformはそれなりに歴史も実績もあるツールで、とてもよくできているので、自分でいちからつくって、Terraformと同レベルで使えるようになるまで育てるのは大変すぎるな、と思っていた。が、gfxさんの記事を読んで、

    CarinaというTerraformライクなツールをつくりはじめた
  • AIで"レビュー渋滞"を解消する 〜PRレビュー支援と社内ワークショップでレビュー文化を変えた実践記録〜

    まとめると、レビュー渋滞を解消するためには下記のサイクルで継続的に改善していくことが重要だと考えました。 レビュー効率化エコシステム全体像 AIによるPR作成自動化 PRを作成する際の手間を削減するため、AIによるPR作成の自動化を導入しました。これは、ブランチ作成・コミット作成・PR作成までの一連のgit処理を自動化し、さらにAIが以下の作業を支援するものです: 差分からPR説明を自動生成: コミット差分を分析し、変更内容を要約したPRタイトルと説明文を生成テンプレートの自動埋め: PRテンプレートの項目(背景、変更内容など)をAIが自動で記入 これにより、PRを作成する側の負担が軽減されるだけでなく、PRのコンテキストが充実することでAIスクリーニングレビューの精度が向上します。さらに、PR内容が標準化されることで、チーム全体でレビューの質が底上げされる効果もあります。 Claude

    AIで"レビュー渋滞"を解消する 〜PRレビュー支援と社内ワークショップでレビュー文化を変えた実践記録〜
  • 生成 AI 時代のスナップショットテストってやつを見せてあげますよ(α版)

  • Claude Codeログ基盤の構築

  • うつわのおはなし 〜華やぐ彩り・九谷焼(後編)〜|ひいな

    ―後編を綴るにあたり― 前編の冒頭で触れましたとおり、九谷焼の歴史にはちょっぴり複雑な背景があります。 これからそれを綴るわけですが、この内容は(ご存知の方もいらっしゃるかもしれませんけれど)とても繊細なことだと思っています。加えて、今なお研究の途上にあることです。日進月歩の研究の世界ですから、今日ここに記したことが、明日には新しい知見によって更新されている――  そんなこともあるでしょう。いえ、現時点のことだって、私には知らないこともたくさんあるかもしれません。 これは、うつわ好き素人が綴るエッセイのようなものです。 私なりに真摯に綴っているつもりではありますけれど、もろもろお含みおき頂きまして、お読み頂けましたら幸いです。 うつわ愛と 九谷焼へのリスペクトは、たっぷり注いでいるつもりです。 九谷焼のちょっぴり複雑な歴史 「古九谷論争」前編の冒頭で、私は九谷焼の歴史を綴るのが難しかったと

    うつわのおはなし 〜華やぐ彩り・九谷焼(後編)〜|ひいな
  • うつわのおはなし ~華やぐ彩り・九谷焼(前編)~|ひいな

    うつわ好きの私は、このnoteにこれまで何度も、九州のやきものについて綴ってきました。 有田や唐津、そして小鹿田おんた焼きなどの魅力を、私のうつわ愛をたっぷり注いで残してきたつもりです。(未熟ではありますけれど。) でもそれ以外のやきものについては、なぜかあまり文字にすることがありませんでした。
日にはまだまだ、素敵なやきものが たくさんあるというのに。 栃木の益子焼については、例外的に綴ったことがあります。けれど、それ以外は「書きたいな」と思ったまま筆が止まってしまったり、ほぼ写真だけの旅記録で終わってしまったり。 中でもとくに石川県の九谷焼については、何度も「書きたい」と思いながら、いつも途中で断念してきました。 それには、ちょっとした理由がありました。 九谷焼は、その美しさの奥にちょっぴり複雑な歴史を抱えていて、それを私などの言葉でどう綴ればよいのか、なかなか見えてこなかったのです

    うつわのおはなし ~華やぐ彩り・九谷焼(前編)~|ひいな
  • 【緊急】axios がサプライチェーン攻撃 2026.03.31

    TL;DR 2026年3月31日、npm で最も利用されているHTTPクライアントライブラリの一つである axios がサプライチェーン攻撃を受けました。攻撃者はリードメンテナーのアカウントを乗っ取り、マルウェアを含む2つのバージョンを公開しています。 項目 内容

    【緊急】axios がサプライチェーン攻撃 2026.03.31
  • AIを使うほど、判断力が落ちる人がいる理由

    記事は、AI時代を生き抜くための「選別と生存」3部作の第1回です。 第1回:AIと判断力の劣化 (記事) 第2回:道具による人類の「自己選別」の歴史 第3回:「AI禁止令」の真の狙いと認知設計 AIは能力を「増幅」しない。「分岐」させる。 2025年以降、エンジニア仕事AIが深く入り込んだ。コード生成、設計案の壁打ち、ドキュメント作成。日常の大半にAIが関与するようになった。 そして、興味深い現象が起きている。 AIを日常的に使っているエンジニアの中で、判断力が明らかに先鋭化している人と、判断力が目に見えて低下している人に分かれ始めている。 少なくとも、私の周囲ではそう見える。 同じツールを使っているのに、結果が逆方向に分岐する。これはAI側の性能差では説明がつかない。使う側の構造の差によって起きている現象だ。 稿では、この分岐がなぜ発生するのかを構造的に分析し、自分がどちら側に

    AIを使うほど、判断力が落ちる人がいる理由
  • 私の考えた最強の OpenClaw 設定 - Qiita

    私の考えた最強の OpenClaw 設定 はじめに 前回、「OpenClawでSandboxを有効化する手順」という記事を書きました。 Sandbox を導入してセキュリティは高まったのですが、使っていく中で「Sandbox だけだと不便な場面がある」ということに気づきました。例えば、cron(定期実行)の設定や Gateway の設定変更は Sandbox 内からはブロックされます。 そこで、マルチエージェント構成を導入して「セキュリティを保ちつつ、必要な権限は別のエージェントに持たせる」という運用にたどり着きました。 この記事では、約1週間 OpenClaw を使い倒して試行錯誤した結果の設定を共有します。 設定自体は早い段階で固まっていたのですが、記事にまとめるのに少し時間がかかってしまいました... この設定で現在 1 週間ほど運用していますが、今のところ快適に使えています。 全体

    私の考えた最強の OpenClaw 設定 - Qiita
  • Agent Safehouse

    Go full --yolo. We've got you.macOS-native sandboxing for local agents. Move fast, break nothing. LLMs are probabilistic - 1% chance of disaster makes it a matter of when, not if.

    Agent Safehouse