kimunetQのブックマーク (609)

  • Linux 7.0でPostgreSQL性能半減、修正困難か

    perfプロファイリングの結果、CPU時間の55%がPostgreSQLのユーザースペーススピンロック(s_lock)で消費されていることが判明した。PREEMPT_LAZY環境下で、ロック競合が劇的に悪化している。原因はプリエンプションモデルの制限問題の根源は、Linux 7.0のrc1で導入されたカーネルスケジューラの変更にある。Intelのカーネルエンジニア、ペーター・ジルストラが作成したコミットが、利用可能なプリエンプションモードを制限した。 従来、Linuxカーネルはサーバー向けに「PREEMPT_NONE」(プリエンプションなし)というモードを提供していた。スループット最大化を優先し、カーネルがタスクを途中で中断しない設計だ。データベースサーバーのように、CPUを長時間占有する処理には理想的なモードだった。 Linux 7.0では、x86やARM64などの主要アーキテクチャでP

    Linux 7.0でPostgreSQL性能半減、修正困難か
    kimunetQ
    kimunetQ 2026/04/05
  • 突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか

    清水 亮 ryo_shimizu 新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。 ソフトウェアの革命は、突然やってくる。 ように見える。 カリフォルニア工科大学(以下カルテック)のババク・ハッシビ教授が率いる研究チームPrismが発表したBonsai-8Bは、驚異的と言って良い性能を持つ大規模言語モデル(LLM)である。 通常のベンチマークは、ベンチマークに使うデータそのものをモデルが学習してしまう場合があるため、筆者が独自に開発した非公開の日語要約能力ベンチマークによると、Bonsai-8Bの性能は驚異的だ。 この表では、精度(ROUGE-L)、推論速度(speed)、サイズ(Size)、品質(Tier)の4点から様々なLLMの日語性能を比較している。 このベン

    kimunetQ
    kimunetQ 2026/04/05
  • 思いつきを手軽にメモ。Claudeでアイデアを残し、広げる仕組みを作ってみた。 | DevelopersIO

    この記事では、Claudeに「メモして」と言うだけでGitHubリポジトリにアイデアが自動保存される仕組みを作った話を、保存先選びの試行錯誤も含めてまとめます。 はじめに こんにちは、あんでぃです。 通勤電車の中、シャワーを浴びているとき、子供の送り迎えの帰り道。ふと「あ、これいいかも」と思いつくことがあります。 こういう思いつきを残すとき、みなさんはどうしていますか?メモアプリを開く?Slackの自分用チャンネルに投げる?Notionに書く? 私はこの「どこに書こう」という選択自体がストレスだと感じていました。ツールが増えるほど「どこに何を書いたか」を管理するコストも増えていきます。 そこで考えたのが、「思いつきのメモ先も、そこからの対話も、全てClaude起点にする」というアプローチです。 普段からClaude(claude.ai)で考え事をしているなら、思いつきもそのままClaude

    思いつきを手軽にメモ。Claudeでアイデアを残し、広げる仕組みを作ってみた。 | DevelopersIO
    kimunetQ
    kimunetQ 2026/04/04
  • NEC「Aterm」シリーズに複数の脆弱性 アップデートまたは買い換えを推奨

    Japan Vulnerability Notes(JVN)は4月3日、日電気(NEC)製の複数のWi-Fiルーターに関する脆弱性情報を公開した。 脆弱性の概要と想定される影響は、それぞれ以下のとおり。 ●脆弱性の概要 ・権限チェックの欠如(CVE-2026-4309) ・パストラバーサル(CVE-2026-4619) ・OSコマンドインジェクション(CVE-2026-4620/CVE-2026-4622) ・セキュリティ上問題のある隠し機能(CVE-2026-4621) ●想定される影響(一例) ・装置固有の情報を取得され、結果として設定を変更される(CVE-2026-4309) ・任意のファイルを上書きされる(CVE-2026-4619) ・任意のOSコマンドを実行される(CVE-2026-4620/CVE-2026-4622) ・telnetサービスを有効化される(CVE-2026

    NEC「Aterm」シリーズに複数の脆弱性 アップデートまたは買い換えを推奨
    kimunetQ
    kimunetQ 2026/04/04
  • エージェントハーネスとAIマネージドサービス|福島良典 | LayerX

    はじめにどうも、すべての経済活動を、デジタル化したい福島です。 2025年は「AIエージェントを試す・使う」という1年でした。2026年は「AIエージェントを実際に組織で機能させ、アウトカムに変える」ことが主題の1年になると思います。 このパラダイムでの質的な価値は「AIエージェント」そのものではなく、エージェントを包み込むインフラ、すなわちエージェントハーネスにあります。そして、このハーネス+エージェントを業務の完成品として提供するのが今後のAI企業の主戦場になるでしょう。その形を「AIマネージドサービス」という造語で解説します。 この記事では、2026年2月頃から急速に注目を集めている「エージェントハーネス」という概念を紹介しつつ、「それってClaude Codeで内製できるんじゃないの?」といったAIエージェント企業に投げられがちな疑問に対する考え方の整理もしてみたいと思います。

    エージェントハーネスとAIマネージドサービス|福島良典 | LayerX
    kimunetQ
    kimunetQ 2026/04/02
  • Claude Codeのソースコード流出、npmソースマップに51万行が丸見えだった件

    Anthropic Claude Codeのnpmパッケージにソースマップが含まれ、1,902ファイル・51万行超のTypeScriptソースが公開状態に。未公開プロジェクト「KAIROS」や107個のフィーチャーフラグなど、内部コードの全貌を解説する。 Anthropicが「うっかり」自社ツールの中身を全公開した Anthropicが提供するAIコーディングツール「Claude Code」の中身が丸見えになった。 ハッキングされたわけではない。Anthropicが自分でnpmJavaScriptのパッケージ管理システム)にコードを公開するとき、「ソースマップ」という来含めてはいけないファイルを一緒に入れてしまった。いわば設計図を製品と一緒に箱に入れて出荷してしまったようなものだ。 発見したのはセキュリティ研究者のChaofan Shou氏。対象は @anthropic-ai/clau

    Claude Codeのソースコード流出、npmソースマップに51万行が丸見えだった件
    kimunetQ
    kimunetQ 2026/04/01
  • ソフトウェアテスト 最初の一歩 〜テスト設計技法をワークで体験しながら学ぶ〜 #WACATE #JaSSTTokyo / SoftwareTestingFirstStep

    JaSST'25 Tokyoでの発表の一部抜粋資料です。 JSTQB(ソフトウェア…

    ソフトウェアテスト 最初の一歩 〜テスト設計技法をワークで体験しながら学ぶ〜 #WACATE #JaSSTTokyo / SoftwareTestingFirstStep
    kimunetQ
    kimunetQ 2026/03/31
  • AI コードレビューで見るべきは拡張容易性 | ソフトウェア自動開発のメモ帳

    AI がコードを書く時代に、レビューで何を見るべきか。「バグがないか」「テストが通るか」は AI 自身がある程度カバーできる。では、人間のレビューに残る仕事は何か。 2026 年 3 月に公開された論文 SlopCodeBench が、この問いに対してデータを出している。同論文の実験では、テストが通っていても、AI が書いたコードは反復するたびに劣化していた。そして、この劣化をテストは検出できなかった。 仕様を繰り返し追加すると何が起きるか 従来のコーディングベンチマーク(SWE-bench など)は、仕様を渡して一発でコードを書かせる評価だ。しかし実際の開発では、コードは何度も拡張される。SlopCodeBench はそこを突いた実験だ。 20 問×93 チェックポイント の構成で、仕様が段階的に追加される。エージェントは自分が前に書いたコードを繰り返し拡張していく。11 のモデルで検証

    kimunetQ
    kimunetQ 2026/03/31
  • Prompt→Context→Harness、全部やった。要件だけ渡す、変わっても壊れない。整合性駆動開発CoDD爆誕

    2025/3/29 19:00 更新 — セクション9「5分で体験するCoDD」を大幅改善。要件定義を平文で渡すだけのフローに変更(codd init --requirements spec.md)。フロントマターもwave_configも全自動生成。 この記事はいつもと毛色が違う。体験記ではなく論考だ。 AI開発の方法論がこの2年で3回変わった。プロンプトエンジニアリング、コンテキストエンジニアリング、ハーネスエンジニアリング。オレは全部リアルタイムで通過してきた。AI部下10人を戦国軍団で運用しながら。 で、3つ全部やった先に、誰も解いていない問題があった。 それを解くツールを作った。pip install codd-dev で公開した。結果、クライアント案件のLMSで要件と制約だけ渡して、設計書18・全コード・全テストをAIに生成させた。 途中で設計判断が変わっても、壊れなかった。

    Prompt→Context→Harness、全部やった。要件だけ渡す、変わっても壊れない。整合性駆動開発CoDD爆誕
    kimunetQ
    kimunetQ 2026/03/30
  • ハーネスエンジニアリング、それGit Workflowをbashで書き直してるだけでは

    結論から言う 2026年3月、AIエージェント界隈で「ハーネスエンジニアリング」が急にバズった。Anthropic、OpenAI、逆瀬川さん、Martin Fowler、arXiv論文、Zennの解説記事が大量に出た。 全部読んだ。 で、気づいたことがある。これ、Git Workflowをbashで書き直してるだけじゃないか? 🗺️ まず、誰が何を言っているのか Mitchell Hashimoto(HashiCorp共同創業者)— 名付け親 2026年2月、ブログ記事 "My AI Adoption Journey" でこの言葉を作った人。 エージェントがミスを犯すたびに、二度とそのミスが起こらないような仕組みを作ること いい定義だと思う。問題は、この「仕組み」が何を指すのかを全員が都合よく解釈し始めたことだ。 Anthropic公式 — 長時間エージェントのコンテキスト消失問題 長時

    ハーネスエンジニアリング、それGit Workflowをbashで書き直してるだけでは
    kimunetQ
    kimunetQ 2026/03/30
  • AIエージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方

    この記事を読んでほしい人 Claude Code / Cursor などのAIエージェントをチームに導入したいエンジニア 情シスから「セキュリティ面の対応は?」と聞かれて技術的に答えたい人 AIツール導入のセキュリティ面の検討材料を探している情シス担当 AIエージェント導入で必ず聞かれる3つの質問 AIエージェントの導入を提案すると、情シスやセキュリティ部門からだいたいこう聞かれます。 Q1: 「AIが何をしてるか見えないけど大丈夫?」 Q2: 「危険な操作を勝手にされない?」 Q3: 「何かあったとき説明できる?」 どれも正当な懸念です。そしてこれらは実は技術的に対応可能です。 技術的な対策の全体像 AIエージェント(Claude Code等) │ すべてのツール呼び出し ▼ [AI Guardian] ← pip install aig-guardian で導入 │ ├─ Activi

    AIエージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方
    kimunetQ
    kimunetQ 2026/03/30
  • ChatGPTが長いチャットで重くなったときに使っている「引き継ぎプロンプト」 - Qiita

    こんにちは。 今回は、ChatGPTを使っているときに自分がよく感じていた 「同じチャットをずっと使っていると、だんだん重くなる…」 という悩みと、そのときに便利だった 新しいチャットへスムーズに移るための引き継ぎプロンプト について紹介。 ChatGPTを使って開発の相談をしたり、記事の下書きを作ったり、設計の相談をしていると、つい1つのチャットでずっと会話を続けてしまいませんか? 自分もかなりやってしまうタイプです。 ただ、会話が長くなってくると、 動作が少し重く感じる スクロールしづらい どこまで話したか見返しにくい 情報は残したいけど、新しいチャットに移るのが不安 みたいな状態になることがありました。 特に最後の 「新しいチャットにしたいけど、今までの流れがちゃんと引き継がれるか不安」 というのが、かなり大きかったです。 今回は、そんな不安を減らしながらチャットを切り替えるために、

    kimunetQ
    kimunetQ 2026/03/29
  • ベクトルDB不要!Pythonで構築する軽量セマンティック検索『concept-file、concept-grep』

    はじめに RAG(検索拡張生成)を試そうとすると、多くの場合「ベクトルデータベース」のセットアップが必要になります。 しかし、「プロジェクト単位でサクッと意味検索がしたい」「DockerDBを立てるほどではない」というケースも多いはず。そんな「重厚なDBはいらないけれど、grepより賢い検索が欲しい」というニーズに応えるため、検索ツール『concept-grep』を開発しました。また、データの保存形式として、concept-fileという仕様を定義しました。 concept-file とは? .concept ファイルは、テキスト・埋め込みベクトル・来歴情報を1つのプレーンテキストファイルにまとめるフォーマットです。ベクトルDBは不要で、cp でコピーすれば知識が移動し、cat で中身を確認できます。 ファイルはヘッダー行(1行)とJSONボディの2セクションで構成されます。 +====

    ベクトルDB不要!Pythonで構築する軽量セマンティック検索『concept-file、concept-grep』
    kimunetQ
    kimunetQ 2026/03/28
  • Google TurboQuant入門 — KVキャッシュ3ビット圧縮でLLM推論を8倍高速化 - Qiita

    はじめに LLMの推論コストを支配する要因のひとつが KVキャッシュ(Key-Value Cache) のメモリ消費である。コンテキスト長が伸びるほどKVキャッシュは線形に膨張し、GPUメモリを圧迫してバッチサイズやスループットを制限する。 2026年3月25日、Google Researchは新しい圧縮アルゴリズム TurboQuant を公式ブログで発表した。KVキャッシュを 3ビットに圧縮しながら精度損失ゼロ を実現し、メモリ使用量を 6倍削減 、NVIDIA H100上で注意機構の計算を 最大8倍高速化 する。論文は ICLR 2026 で発表される。 この記事では、TurboQuantの技術的な仕組みからベンチマーク結果、コミュニティ実装を使った導入方法までを解説する。 この記事で学べること KVキャッシュがLLM推論のボトルネックになる理由 TurboQuantの2段階圧縮アル

    Google TurboQuant入門 — KVキャッシュ3ビット圧縮でLLM推論を8倍高速化 - Qiita
    kimunetQ
    kimunetQ 2026/03/28
  • 「誰かがやるだろう」をやめた1年間の記録 - KAKEHASHI Tech Blog

    はじめに 今年は変化した一年だったなぁ。一番の変化というと個人の課題からチームの課題へと視座感が変わったところで、それまでは個人のスキルアップが目標のほとんどだったけど、チーム状況の変化を目の当たりにして今のままだとダメだなと感じ、チームの課題を自分の課題と思って取り組めるようになったのが大きな変化だった。 それによって主体的に動き・提案したり既存フローを変えたりして、これまでマネージャー層が現場の意見を聞きながら少しずつ調整かけていたものを現場の目線でいい感じに変えられるようになったし、実際手応えも感じることができた(あとは、変化したやり方がまだ浸透しきっていない感じはするので、文化として当たり前の状況にしていけるといいのだけれど) これは2025年末に、私がSlackに残したつぶやきです。 カケハシでAI在庫管理プロダクトの開発に携わっている清水(@_smzst)と申します。この記事で

    「誰かがやるだろう」をやめた1年間の記録 - KAKEHASHI Tech Blog
    kimunetQ
    kimunetQ 2026/03/28
  • 基本情報技術者試験をスキル棚卸しに使う - 45歳エンジニアが発見した意外な盲点 - Findy Tech Blog

    キャリアプロダクト開発部の森 @jiskanulo です。 私ごとですが今年で45歳、WEBサービスの開発歴は20年以上になります。世間的にはベテランエンジニアとかシニアエンジニアとかと称される類だと自認しています。 そんな私ですが2026年1月に基情報技術者試験を受験して合格しました。 この記事は、ベテランエンジニアが基情報技術者試験をスキル棚卸しツールとして活用した体験と、受験しなくても使えるセルフチェックの方法を紹介します。 www.ipa.go.jp 受験の動機 結果 得意と苦手が可視化された 得意だった領域 苦手だった領域 得意と苦手のコントラストが意味するもの 試験範囲でスキルを棚卸しする方法 受験のTips CBT受験の雰囲気 集中力の維持に課題 まとめ 受験の動機 受験したきっかけは昨今のAIエージェントを前提とした開発手法の変化です。 ファインディではAIエージェント

    基本情報技術者試験をスキル棚卸しに使う - 45歳エンジニアが発見した意外な盲点 - Findy Tech Blog
    kimunetQ
    kimunetQ 2026/03/27
  • なぜ、基準に満たない低スキルのメンバーがPJにいることが管理職最大の罪なのか?

    はじめに プロジェクトの失敗要因は、一般には進捗管理や報連相やリスク管理の不足として語られます。もちろんそれらは重要です。ですが、客先常駐や準委任のように顧客が日々の挙動を直接見ている現場では、それより手前にある決定的な変数が見えてきます。それが、案件の要求水準に対して基準未達のメンバーを入れてしまうことです。 しかも問題の中心は、アサインされた人そのものではありません。人の力量が不足していることを知りながら、あるいは見極めずにその案件へ投入し、その後の吸収を現場へ押しつける側にあります。ここで起きているのは単なる教育不足ではなく、編成判断の誤りを現場の自己犠牲で埋め合わせさせる構造です。 この問題が厄介なのは、プロマネ研修ではほとんど教えられないことです。研修で扱われるのは体系化された管理技法であり、基準未達の人員投入がどれほど顧客価値と現場負荷を壊すか、その現実は抜け落ちやすいです

    なぜ、基準に満たない低スキルのメンバーがPJにいることが管理職最大の罪なのか?
    kimunetQ
    kimunetQ 2026/03/27
  • 仕事はすべてSkillに書け - それ、Skill にしない?

    「それ、Skill にしない?」 最近、自分の口癖がこれになった。誰かがSlackで手順を聞いてきたとき。自分が同じ作業を3回目にやったとき。同僚にレビューの観点を説明しているとき。 タイトルは盛ってる自覚はある。でも実際に50個以上作ってみて、割と気でそう思っている。 仕事のやり方が驚くほど変わった。仕事を「やる」のではなく「書く」ようになった。 「ドキュメント書きましょう、なんて話は100回聞いたよ」と思うかもしれない。ただ、Agent Skill をきっかけに「仕事をドキュメント化する」ことの重要性が爆発的に高まった。 ConfluenceやWikiに書いた手順書は、大抵は書かれて終わり。SKILL.md に書いた手順は、AIが読んで、そのまま実行する。 これからは 「ドキュメントにしましょう」ではなく「Skillにしましょう」が合言葉になる 言葉にすれば、誰でも使える指南書になる

    仕事はすべてSkillに書け - それ、Skill にしない?
    kimunetQ
    kimunetQ 2026/03/25
  • Claude Codeに長期記憶を持たせたら、壁打ちの質が変わった

    どうも、AIエンジニアの@noprogllamaです。普段はAIで日常の仕組み化をしたり、投資×テクノロジーの実践知を発信したりしています。 CLAUDE.mdという仕組みがあります。プロジェクトのルートに置いておくと、Claude Codeがセッション開始時に読み込んで、プロジェクトの方針や技術スタックを把握してくれます。開発に必要な情報はこれで十分伝わります。 ですが、CLAUDE.mdには書けないものがあります。 「前にこの方針で議論して、こういう理由で却下したよね」「あの時ハマったの、覚えてる?」——過去の会話の文脈です。 私はClaude Codeを開発だけでなく壁打ち相手としても使っています。戦略の相談、記事の構成、設計判断の議論。こういう用途では、過去に何を話したかが重要です。新しいセッションを開くたびに前提の共有からやり直すのは、率直に言ってしんどい。毎朝出社したら同僚が記

    Claude Codeに長期記憶を持たせたら、壁打ちの質が変わった
    kimunetQ
    kimunetQ 2026/03/23
  • Claude Code のスキルとして動作する日報自動生成ツールを作った - じゃあ、おうちで学べる

    はじめに 夕方6時、日報を書こうとしてターミナルを開く。今日何をしたか——思い出せない。Slack を遡り、PR の履歴を見る。20分かけてようやく事実を集め終えたが、「今日の振り返り」の欄がまだ空白のまま残っている。 半年前に「Claude Codeのスラッシュコマンドで日報を書く」という記事を書いた。 syu-m-5151.hatenablog.com あの仕組みは、それなりに機能していた。だが使い続けるうちに、いくつかの限界が見えてきた。 手動でメモを追加する必要がある。Claude Code で作業した記録はすべてログに残っているのに、わざわざ二重に記録している。日報の面倒さの大半は、この「思い出す作業」にあった MCP(Model Context Protocol)サーバーで分析を試みたが、セットアップが重い。Python環境の管理、依存関係の解決、サーバーの起動。日報のために毎

    Claude Code のスキルとして動作する日報自動生成ツールを作った - じゃあ、おうちで学べる
    kimunetQ
    kimunetQ 2026/03/23