[B! LLM] T-norfのブックマーク

セキュリティ診断、AIに全部やらせたら月$0.5で回せるようになった話💰

📢 アップデート版を公開しました（2026/05/01）この記事のあと、3スキル体制に分割 + テストハーネスで検出率100%を達成しました。最新の使い方は以下の記事をどうぞ。 👉 claude-security-scanを3スキル体制にアップデートしたら月$1未満で検出率100%を達成した話🎯 はじめにこんにちは、Sabakanです。今回、Claude Code 用のセキュリティ診断スキル claude-security-scan を作って公開しました。正直、自分でもびっくりするくらい実用的なものができたので、紹介させてください。リポジトリはこちら → https://github.com/sabakan0123/claude-security-scan こんな気持ち、ありませんか？「セキュリティ診断、ちゃんとやりたいけど Burp Suite の使い方よくわからん」

T-norf 2026/05/02

リンク

DeNA南場会長、AIのOpenClawと格闘　｢まだ同僚じゃない｣ - 日本経済新聞

ディー・エヌ・エー（DeNA）はソフトウエアの開発で人工知能（AI）エージェント「Devin（デビン）」を全社員向けに導入し、AIをフルに活用する組織への変革を進めている。南場智子会長はパソコン操作を自動化するAIエージェント「OpenClaw（オープンクロー）」など最新技術を試し、AI時代の経営者像を探る。3月下旬に米サンフランシスコを訪れた南場氏に、AIの活用や日本の課題を聞いた。（聞き手は

T-norf 2026/04/25

ここまで情報発信してくれる経営者は、国内ではなかなか他におらんし、興味深い。これまでは試行錯誤してきたけど、そろそろ非成長部門から人を抜く動きとして「26年から規律を強める。きめ細かいルールを設計中」

リンク

米スペースX、9.6兆円で「Cursor」買収権　プログラミングAI強化 - 日本経済新聞

【シリコンバレー=山田遼太郎】起業家イーロン・マスク氏が率いる米スペースXは21日、プログラミング用の人工知能（AI）サービスを開発する米新興Cursor（カーソル）を600億ドル（約9兆6000億円）で買収する権利を得たと発表した。スペースXによると、カーソルを2026年内に買収するか、共同開発の対価として同社に100億ドルを支払うかを選ぶ権利を得たという。ソフトウエア技術者に支持されるカー

T-norf 2026/04/22

そこまでのバリューないだろと思ったけど、コーディングした履歴が大量に蓄積されていれば、Grokのコーディング性能を高める学習用データとしても欲しいのかな

LLM
開発

リンク

OpenAIが新モデルSpud着手、動画Sora撤退　AI「使い放題」幻想に幕 - 日本経済新聞

【シリコンバレー=山田遼太郎】米オープンAIが対話型AI（人工知能）「チャットGPT」の基盤となる新モデル「Spud（スパッド）」開発のため、動画AIの提供を終了する。高性能半導体の需給逼迫や電力代高騰で、AIはコンピューターの資源を無尽蔵に消費する手法が限界を迎え、用途を効率的に絞る必要が出てきている。「とてもつらい決断だが、全ては計算資源の問題だ。本業であるAGI（人間並みの汎用人工知能）

T-norf 2026/03/31

GoogleのAgent Smithが抜けてるけど、各社とも、もう一段Agent・コーディング性能を上げたモデルを出してくるのが4～6月頃。ここらへんが出る頃に、没頭して使い倒したいな。でも、需要過多で、値上げ・従量課金化の予想も

LLM

リンク

Google Workspace CLI（gws）が登場！早速インストールしてClaude Codeから操作してみた | DevelopersIO

Google Workspace CLI（gws）が登場！早速インストールしてClaude Codeから操作してみたこんにちは。サービス開発室の武田です。 Google Workspaceをコマンドラインから操作できるCLIツール「gws」が、Googleの公式Organization（googleworkspace）配下でリリースされました！これまでGoogle WorkspaceのCLIツールといえば3rd party製のものしか選択肢がありませんでした。ついにgoogleworkspace orgから出たということで、さっそくインストールしてClaude Codeから触ってみました。注意: READMEには"This is not an officially supported Google product."という免責事項が記載されています。また、本記事執筆時点（2026年3

T-norf 2026/03/06

Githubで“This is not an officially supported Google product”まで見てブクマしなかったんだけど、これ半公式だったのか。としたら気になるな

LLM

リンク

Claude Code に向いているプログラミング言語

ターン数とは、1 回のプロンプト実行中に Claude が何回 API ラウンドトリップ（ツール呼び出し → 結果受け取り → 次の応答）を繰り返したかの回数です。 v1（新規作成）の所要時間 v1 では言語間の差が大きく出ています。Python（32.9 秒）と Ruby（33.2 秒）が僅差でトップ、JavaScript（36.0 秒）が続きます。一方、Ruby/Steep は 105.0 秒と Ruby の約 3.2 倍。Lua（96.4 秒）や OCaml（80.9 秒）も遅め。 v1 は空のディレクトリからスタートするので、Cargo.toml や package.json などのプロジェクト設定ファイルを生成するコストが含まれます。Python/Ruby/JavaScript などは minigit ファイル 1 つを生成するだけで済むので、差が大きくなっている可能性があります

T-norf 2026/03/05

直感的にはそうなんだけど、どうだろね　“題材の規模が小さすぎる。型システムは規模が大きくなったときに効くはずだ。”

LLM
開発

リンク

突撃！隣のClaude Code！！ - エムスリーテックブログ

AI・機械学習チームの髙橋です。みなさま、コーディングライフいかがお過ごしでしょうか。エムスリーでは、昨年初夏頃からエンジニアに対してClaude Codeの業務における無制限使用が解禁されています。現在ではほぼすべてのエンジニアが普段からClaude Codeを利用し、AIレビューやチーム内でのプラグインによるSkill共有が進んでいます！ということで今回は、以前の突撃！隣のキーボード M3 2024 - エムスリーテックブログのスピンオフとして、エムスリーのエンジニアメンバーが実際に利用している便利なClaude Codeのカスタマイズを募集し、紹介します！例のしゃもじ前置き：Claude Codeのカスタマイズとは Claude Codeではエージェントに対してユーザ・プロジェクト固有の指示や制約を与えることができます。昨今はSkillsが特に話題となっていますが、こ

T-norf 2026/01/30

これはいいまとめ

リンク

GitHub Copilot CLIは、gpt-5.2-codex xhighに複雑なレビューを依頼しても1回4円

2026.01.28 - 追記開始コメントで教えていただきましたが、設定ファイルで直接設定すればCLIじゃなくVS拡張でもReasoning Effortを指定できるようです。参考：GitHub Copilot で xhigh（Extra High）推論を使う 2026.01.28 - 追記終了皆さん、GitHub Copilot使ってますか？私は日常的に使っています。 GitHub CopilotってほかのAIハーネスと違って、サブスクの課金体系が入出力トークン量ではなく、「プレミアムリクエスト」という謎単位で課金されます。これを実はうまく利用すると、GPT-5.2-Codex xhighでがっつりレビューさせたり調査させても、最安1回4円で使えます。 GitHub Copilotでコスパ良く活用するコツこれにはコツがあって… GitHub Copilot CLIを使う（VS拡

T-norf 2026/01/25

うちのメンバーだと余らせてるだろうなぁ。先端連中は、claude codeかGemini CLIというのもあるだろうけど

リンク

Anthropicハッカソン優勝者のClaude Code設定集「everything-claude-code」を読み解く

Anthropicハッカソン優勝者が10ヶ月以上かけて実際のプロダクト開発で使い込んだ everything-claude-code というリポジトリが公開されていたので、内容を読み解いてみました。この記事の要約 Anthropic x Forum Venturesハッカソン優勝者が公開した本番環境で使えるClaude Code設定集 agents, skills, hooks, commands, rules, MCP設定の6種類のファイルで構成コンテキストウィンドウは 200kから70kまで縮小する可能性があるため、MCPの有効化は10個以下に抑える TDD（テスト駆動開発）を中心にしたワークフローで、カバレッジ80%以上を必須とする /tddや/planなどのスラッシュコマンドで素早くワークフローを呼び出せる hooksによる自動化でフォーマット実行やconsole

T-norf 2026/01/20

リンク

Google、「Gemma 3」ベースの翻訳特化モデル「TranslateGemma」公開　日本語含む55言語に対応

米Googleは1月15日（現地時間）、オープンなAIモデル「Gemma 3」をベースにした翻訳特化モデル群「TranslateGemma」を発表した。高品質な翻訳を、より小さなモデルサイズで実現することを狙ったオープン翻訳モデルの新しいスイートと位置付けている。日本語を含む55言語をサポートし、4B、12B、27Bの3サイズを用意した。翻訳エラーを追跡する指標である「MetricX」を用いて品質を測定（スコアが低いほど高精度）したところ、12B TranslateGemmaのスコアは3.60で、27BのGemma 3ベースモデルの4.04を上回った。同じサイズのGemma 3の12Bベースモデルと比較すると、エラー率は約26％低下した。

T-norf 2026/01/17

ローカル実行できる、軽量マルチモーダル翻訳専用オープンモデル

LLM

リンク

Geminiの「Gem」機能のTips集(1/3)：基本編｜榎本大貴 / LITALICO研究所所長

この記事はLITALICO Advent Calendar 2025として書こうと思っていたのですが、まんまと遅延してしまい、さすがに2025年中には出さないといけないと思ってなんとか書き上げたものです。書いていくうちに10,000文字を超えてしまい、さすがに１記事にするのは微妙かと思って分割しました。 ▼LITALICO Advent Calendar 2025はこちらでは、早速どうぞ。はじめにGoogleの生成AIであるGeminiには「Gems」という機能があります。これは、プロンプトを保存・再利用・共有できる便利な機能なんですが、実は効果的に使うにはいくつかのコツがあるんですよね。僕自身、試行錯誤しながら使っていく中で「あ、これ便利だな」と思ったTipsをまとめてみました。記事の全体像は、下記の通りです。前提（今回の記事）基本編（今回の記事）応用編（２記事目）実践

T-norf 2026/01/02

リンク

RAGの精度が73%から100%に向上した話 ─ チャンキング戦略の比較検証

はじめに RAG（Retrieval-Augmented Generation）システムを構築していると、「なぜか精度が上がらない」という壁にぶつかることがあります。本記事では、社内規程文書を対象としたRAGシステムで、回答精度を73.3%から100%に改善した過程を紹介します。検証した複数のチャンキング戦略の中で、意外にも最もシンプルな解決策が最も効果的だったという結果になりました。また、「Re-rankingを導入すれば精度が上がる」と思っていたのですが、逆に精度が下がるという予想外の結果も得られました。その理由についても考察します。プロジェクト構成技術スタックレイヤー技術

T-norf 2026/01/01

シンプルな話。今のLLMは賢いしRAGに慣れてきたから、従量課金とか気にせずベクトルヒットした前後テキストを付加した大きめのチャンクを渡し、リランカでのノイズ除去とか気にするなという話。GPT-3.5の頃とは違うのね

RAG
LLM

リンク

Claude Code中心のAIコーディング運用：実務で効いた5つの型

AIコーディング前提の開発プロセスを仕組み化はじめまして。松尾研究所の中川です。 AIコーディングを前提に、提案から開発・運用までを一気通貫で進めるスタイルは増えつつあります。弊社のプロジェクトでも、AIコーディングは単なる「補助」ではなく、開発プロセスの中核として扱われる場面も多くなってきました。私も小規模体制で開発速度と品質を両立するために、Claude Codeの運用における並列化・プロンプト運用・レビュー自動ループ・ナレッジ一元化・インストラクション（Skills）の5点を“仕組み”として作っています。この記事では、Claude Code中心のAIコーディング手法をまとめます。開発対象 Claude Codeの実務運用で開発したWebアプリ構成です。フロントエンド： React + Vite + TypeScript バックエンド： FastAPI 非同期処理ワーカー

T-norf 2025/12/27

リンク

AI活用100本ノック（DeNA）

T-norf 2025/12/24

リンク

Nano Banana Pro でストーリー漫画の作成を試す｜npaka

「Nano Banana Pro」でストーリー漫画の作成を試してみました。 1. Nano Banana Pro でストーリー漫画の作成を試す作成した漫画は、次のとおりです。 2. Nano Banana Pro でストーリー漫画の作成手順2-1. キャラクター設定画像の作成「Nano Banana Pro」でキャラクター設定画像 (1K) を作成します。設定は「ChatGPT」と相談して作成しました。キャラクター設定の画像を作成して。 ## 琴音こだま（主人公） - 高校1年生女子 - 極度のコミュ障／人見知り - 身長150cm - ピンクロング、猫背ぎみ - ストリートファイター2の異様な上手さが取り柄 - ゲームパッドを抱えて生活している - ふだんはぼそぼそ喋るが、対戦中は豹変 # 美咲（サブキャラ／友達役） - 同級生女子 - 黄色ポニーテール - 明るい／人当たりが

T-norf 2025/12/22

年末年始も近いと「あとで読む」を量産してしまう。（読むかは知らんけど）

リンク

AntigravityとGemini 3でアプリ開発したら、めちゃくちゃ効率的だった話

こんにちは。SCSKの松渕です。先日、発表されたばかりのGoogle Antigravityをインストール＆簡易WEBサイト構築してみましたが、今回はもう少しアプリ開発をしてみた実体験をブログに書きます！はじめに Antigravityとは AWSのKiroと同様に、AIエージェント型統合開発環境（Agentic IDE）と呼ばれるものです。 Antigravityのポイントとしては、特に以下の点になるかと思っております。・ AIによるブラウザ操作も可能・ AIによる自律的な実装・アウトプット品質の高さ（これはGemini 3のポイントではありますが）・ Google Cloud環境とのシームレスな連携類似サービスとの比較は以下の通りです IDE/プラットフォーム開発元主な設計思想と特徴類似サービスとの差別化ポイント Antigravity Google エージェン

T-norf 2025/12/17

年末年始はGoogleのサブスクを一旦契約してこれで遊ぶか、Codexで遊ぶかどっちにするべか

LLM
開発

リンク

RAGの「リランキング」を10倍速くする「MixLM」

本記事では、RAGの応答速度を速くするための「MixLM」という手法について、ざっくり理解します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。この記事は何この記事は、RAGで必須の手法「リランキング」の速度を飛躍的に高める「MixLM」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は、こちらの記事もご参考下さい。本題ざっくりサマリー「MixLM」は、RAGの応答を高速にするための手法です。LinkedInの研究チームによって2025年11月に公開されました。通常のRAGでは、リランキングという手法がよく使われます。これは何かというと、ベクトル検索で取ってきた文書を「ユーザーの質問との関連性」で並び

T-norf 2025/12/17

“Encoder LLM”が何してるか分からんので元論文見ないと本質分からない

リンク

AIコーディング実践環境の構築方法【2025年12月】

この記事は、松尾研究所 Advent Calendar 2025の記事です。本記事ではAIコーディングを実践するための環境構築方法が分かります。具体的なポイントは以下となります。 2025年12月時点での、Claude Code を中心としたAIコーディング環境の構築手順 AIコーディングに必要なツールの概要、セットアップ方法、使い方仕様駆動開発でソフトウェア開発する流れと具体的な実践方法 AIコーディングツールの現状今年（2025年）の3月にAIコーディングツールについてブログ記事を書きました。この頃は、当時勢いのあったClineを使っていましたが、わずか半年で使用するコーディングツールも、新たにClaude Code、 Gemini CLI、Codex CLIといったCLIベースのツールに加え、LLMと繋がって様々な機能を実現するMCPといった便利な仕組みも出てきて、日々ベストプ

T-norf 2025/12/02

リンク

生成AIで上がらなかった開発組織の生産性？！ - AI駆動開発の実現に向けて取り組むべきこと｜山田裕一朗（CEO at Findy Inc.）

2025年、Findyそして世界中のあらゆる企業のエンジニア組織は生成AIの大きなうねりを受けて、今まさに変革を迫られています。ちなみに、2023年〜24年はGitHub Copilotなども出てきており、AIがエンジニアの開発に浸透してくることは理解しつつも、そこまで大きく働き方を変える存在になると認知できていませんでした。便利だけどまだまだ精度が十分ではないというのもあったり、そこまで大きな働き方の変化をもたらさないと思いたいという正常化バイアスもあったように思います。しかし今年の３月にセールスフォース社が「AI導入が成功したので今年はエンジニアを雇わない」という発表を行ったり、海外の企業でリストラが加速したことにより、エンジニアの採用ニーズが大きく変わるのではという懸念が業界を流れました。並行して各社のAIの精度も向上する中で、AIの活用を通じてエンジニアの働き方が間違いなく変わ

T-norf 2025/11/28

コーディングアシストだとジュニアが助かり、AIエージェントにやらせるのはシニアじゃないと使いこなせないって感じかな。ここら辺、他社の話が本当にいろいろ知りたい

LLM
開発

リンク

AIが仕事を奪ったら、誰が製品を買うのか？「それをCEOたちは考えていない」 | Business Insider Japan

「AIのゴッドファーザー」と呼ばれるジェフリー・ヒントン。Mert Alper Dervis/Anadolu via Getty Images ジェフリー・ヒントンは、CEOたちがAIによる大量失業が消費に与える影響について考えているとは思えないという。ヒントンは、「AIは新しい仕事を生み出すよりも、むしろ多くの仕事を奪う可能性が高く、ホワイトカラーの仕事に影響を与える」とジョージタウン大学の講演会で主張している。この講演会に参加したジョージタウン大学の学生たちは、AIが将来の就職や経済的安定に悪影響を及ぼすのではないかと懸念を示していた。「AIの父」と呼ばれるジェフリー・ヒントン（Geoffrey Hinton、は、企業の最高経営責任者（CEO）たちに対して現実を突きつけている。 AI（人工知能）の基盤技術である機械学習で先駆的な貢献を行い、ノーベル賞を受賞したイギリス系カナダ人のジェフ

T-norf 2025/11/28

まあよくある議論よね。一番インパクトあるのはノーベル賞受賞者がこう言っていることかな「しかし忘れてはいけないのは、我々はまだごく初期の段階にいるということだ」

リンク

はてなブックマーク

タグ

関連タグで絞り込む (21)

LLMに関するT-norfのブックマーク (303)

お知らせ

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス