はじめに 画像やPDFのテキストをコピーしたいとき、オンラインのOCRサービスに画像を送るのはちょっと抵抗がありませんか? 特に社外秘の資料や個人情報が写っている場合。 通信ゼロ、ブラウザの中だけで完結するOCR があれば安心して使えるのに — そう思って、Chrome拡張機能を作りました。 以前からいくつかの日本語OCRを試してきて、ブラウザ内でも実用レベルで動くことがわかっていたので、それを誰でも気軽に使える形にしたかったのが動機です。 yomitokuで作る日本語OCR Webアプリ — サーバーサイドで高精度な日本語OCR Tesseract.jsでカスタムモデルのトレーニング — ブラウザOCRの可能性と限界 ブラウザだけで完結する日本語OCR+透視変換 — NDLOCRをブラウザで動かす Chrome Web Store で「オフラインOCR」と検索してもヒットします。 これま
各Skillの詳細解説 1. Playwright Browser Automation 概要 ClaudeがPlaywrightを使用してブラウザ自動化を実行するSkill。事前に用意されたスクリプトに制限されず、ユーザーの要求に応じてカスタムのPlaywrightコードをその場で記述・実行できる。 こんなときに使う Webサイトのテストを行いたいとき ブラウザ操作を自動化したいとき フロントエンドのUIテストやデバッグが必要なとき 具体的なユースケース ログインフローのテスト フォーム入力・送信の自動化 レスポンシブデザインの検証(複数ビューポートでのスクリーンショット取得) リンク切れのチェック E2Eテストの実行 使用例 2. prompt-engineering 概要 LLMのパフォーマンス、信頼性、制御性を最大化するための高度なプロンプトエンジニアリング技術を提供するSkill
はじめに miseとは 上記公式ドキュメントのHomeで強調されている通りですが、 Dev Tools asdfのような開発ツール管理 Environments direnvのような環境変数管理 Tasks makeのようなタスクランナー の3つの機能をコンセプトに挙げているCLIツールです。 zenn記事での実践例だと、以下が参考になります。 経緯 私は業務・個人開発共にmiseを愛用しているのですが、開発環境をIaCのように静的なmiseの設定ファイルで記述するのはプロジェクト(リポジトリ)単位がほとんどでした。 マシンに対してグローバルに適用するdotfiles管理での設定ファイル記述はmise Dev Tools機能の活用に留めていましたが、今回その他の機能も活用してdotfiles管理をmiseに集約したので記事として残します。 成果物 以下、dotfilesリポジトリです 今回
社内のチームメンバー(クラウド事業本部コンサルティング部)向けに 「 Claude Code を安全に使おう勉強会 」を開催しました。 Claude Code をセキュアに使う上での、 基本的な考え方や権限/サンドボックス機能の紹介、簡単なデモを実施しました。 DevelopersIO向けに調整したスライドを掲載します。 以下勉強会で連携した設定サンプルです。 Claude Code を安全に使おう勉強会: 補足資料 - Gist スライドの内容:テキスト情報を以降に記載します。参考になれば幸いです。 イントロ 勉強会の目的やアジェンダ、スコープについて話します。 勉強会の目的 Claude Code (に限らず、AIエージェント) はとても便利です。 しかしリスクもあり、暴走もします。 この勉強会では、 Claude Codeが適切な範囲で適切に動けるような、 ガードレールの敷き方 を学
「Claude Codeを使い始めたけど、毎回同じような指示をプロンプトに書いている気がする…」と感じていませんか? Claude Codeは素のままでも強力ですが、Skillsを使うことで繰り返しの作業を自動化し、開発のルーティンをまるごとコマンド一発に変えることができます。この記事では、開発の自動化に特に役立つSkills 5選を、具体的な使いどころとともに紹介します。 「毎回同じプロンプトを書くのが面倒」「チームの開発フローを統一したい」と感じているエンジニアに、特に読んでほしい内容です。 結論:Skillsは「賢いマクロ」ではなく「文脈を持った自動化」 一般的なマクロやシェルスクリプトは、決められた手順を機械的に繰り返すだけです。でも Claude Code の Skills は違います。プロジェクトのコンテキストを理解した上で、状況に応じた判断をしながら自動化を実行してくれます。
はじめに Claude Code を長く使っていると、CLAUDE.md が太ります。過去の失敗パターン、ワークフロー、ツールの使い方を書き足すたびに、ファイルが肥大化していきます。 気づいたら 2000 行近くまで育ち、どんな小さな作業でも毎セッションで全文を読み込ませていました。タスクに取りかかる前から、過去の注意書きだけでコンテキストの大部分を使っている状態でした。 この記事では、そこから 起動時のコンテキスト消費を約 83% 削減 するまでの試行錯誤を書きます。結論だけなら「rules/ と skills/ に切り分けた」ですが、2 ヶ月かけて行きつ戻りつしながら削った記録の方が実用的なので、そちらを中心に書きます(実測値は後半)。 最初はこうだった(失敗の出発点) 過去の commit ログを掘り返すと、2 月時点で以下のような状態でした。 SuperClaude Framewo
Iteration 0 — description と body の整合チェック(静的、dispatch 不要) frontmatter description が謳う trigger / 用途を読む body がカバーする範囲を読む 乖離があれば iter 1 に進む前に description か body を合わせる 例: description「navigation / form filling / data extraction」と書いてあるが body は npx playwright test の CLI ref のみ、のような乖離を検出 これを飛ばすと、subagent は description に合わせて body を「再解釈」し、実質 skill が要件を満たしていないのに精度が出る(false positive) ベースライン準備: 対象プロンプトを確定し、次の 2
本記事は takt v0.35.4 を基準に執筆しています。2026-04 時点の最新は v0.37.0 のため、新しいオプションや挙動の変更がある可能性があります。最新版は npm view takt version で確認してください。 はじめに AI コーディングエージェントを使った開発で、こんな課題を感じたことはないでしょうか。 単一モデルの限界 AI にコードを書かせて、同じ AI にレビューさせる。これは人間の開発で言えば「自分で書いたコードを自分でレビューする」のと同じです。以下のような問題が起きがちです。 自己強化バイアス: 自分が生成したコードの問題を見つけにくい。同じモデルは同じ思考パターンで評価するため、実装時に見落とした問題はレビュー時にも見落とす傾向がある モデル固有の癖: 各モデルには得意・不得意がある。あるモデルが好むパターン(過剰な抽象化、不要なコメント、存
Claude Code がファイルを編集したり、タスクを完了したり、入力が必要になったりしたときに、シェルコマンドを自動的に実行します。コードをフォーマットし、通知を送信し、コマンドを検証し、プロジェクトルールを適用します。 Hooks は Claude Code のライフサイクルの特定のポイントで実行されるユーザー定義のシェルコマンドです。これらは Claude Code の動作に対して決定論的な制御を提供し、LLM が実行を選択するのに依存するのではなく、特定のアクションが常に発生することを保証します。Hooks を使用して、プロジェクトルールを適用し、反復的なタスクを自動化し、Claude Code を既存のツールと統合します。 判断が必要な決定については、決定論的なルールではなく、Claude モデルを使用して条件を評価する プロンプトベースの hooks または エージェントベー
はじめに こんばんは、mirukyです。 2026年3月31日、npmの Axios パッケージ(週間1億ダウンロード)がサプライチェーン攻撃を受けました。攻撃者はメンテナーへの標的型ソーシャルエンジニアリングでセッションを乗っ取り、悪意ある依存 plain-crypto-js を注入した axios@1.14.1 と axios@0.30.4 をレジストリに公開しました。このパッケージは postinstall フックで多段階RATを展開し、macOS・Windows・Linuxすべてに対応する本格的なバックドアを設置するものです。影響はOpenAIのmacOS署名パイプラインにまで及び、証明書のローテーションが実施される事態となりました。 OWASP Top 10:2025でも Software Supply Chain Failures(サプライチェーンの障害)が第3位 に新設される
[注意]AIに書かせた記事をそのまま私の方でレビューして掲載しています。 Claudeマーケットプレイスにだしたらまた更新するかも?よろしくおねがいします。 @追記: 2026年4月18日 Claudeのマーケットプレイスに無事公開されました🎉 genshijin@v1.3.0を公開しました。マルチエージェント対応やセキュリティ対応、ベンチマーク更新などを含めています TL;DR caveman: Claude Code向けの英語圧縮スキル。冠詞やフィラーを消してトークン約68%削減 genshijin(原始人): cavemanの日本語最適化版。敬語・クッション言葉・冗長助詞を消してトークン約80%削減 cavemanよりさらに38%少ないトークンで同じ技術的内容を伝達できる なぜそんなことが可能なのか? Claudeのトークナイザと日本語の言語構造に秘密がある はじめに:あなたのCl
AIエージェント開発では、モデル選定やツールはもちろんですが、それらを正しくハンドリングするための振る舞いの指示となるプロンプト(コンテキスト)の設計が肝です。すでに多くの企業がエージェントを製品に組み込んでおり、先行者の知見を自身の開発しているAIエージェントに活かせると効率的です。 とはいえ、実際のプロダクトがどんな指示やルールで動いているかは製品の価値そのものであるがゆえに、多くの企業はそれらを公開せず、外から見えないことがほとんどです。 GitHub Copilotはプロンプトも含めてOSS 実はGitHub Copilot(VS Code向け)のプロンプトを含むソースコードはGitHubの公開リポジトリで読めます。MIT Licenseも付いているので、製造元が意図した状態で内容を参考にしたり、自分のプロジェクト向けに手を入れたりできます。そのままコピペすればよいという話でもあり
はじめに カウシェでは、PRの83%が人間のコードレビューを経ずに自動でマージされています。 GitHub Actions上で動くAIレビュー(Claude Code Action)がPRを自動でApproveし、CIが通ればそのまま自動マージされる仕組みです。 本記事では、レビュールールを毎晩自動改善する仕組みを作ることで、自分たちの運用で許容できるレベルまでAIレビューの精度を引き上げた話を書きます。 これが成り立つ前提 カウシェはtoCのECプラットフォームで、バックエンド・フロントエンド・モバイルを1つのモノレポで開発しています。 決済や認証など不可逆な領域は人間がレビューしていますが、それ以外は万一バグが出ても迅速にロールバックや修正デプロイで対応できるので、auto-mergeという選択肢が取りやすい環境です。 その上で、83%の自動マージはAIレビューの精度だけで成り立ってい
こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日はClaude Codeの最新バージョンで日本語を書いていると発生する文字化け問題と、hooksを使った簡易的な対応方法についてまとめていきたいと思います。 2026-04-08 追記: Claude Code v2.1.94で本問題が修正されたとのChangelogが出ましたが、完全には治っていないという報告もあります。引き続きhook対策を入れておくのがおすすめです。また、hookをPreToolUseからPostToolUseに戻しました。PostToolUseのほうが書き込み済みの壊れた箇所だけを修復すればよく、修復のためのtokenコストが小さいためです。 起きていること Claude Codeで日本語を含むコードやドキュメントを書いていると、WriteやEditツールでファイルに書き込まれた内容に �(U+FFFD、U
4月4日、元Tesla AI責任者でOpenAI創設メンバーのAndrej Karpathy氏が「LLM Wiki」と題したGistを公開した。 RAGの根本的問題を解決する革新的アプローチ Karpathy氏が提案したのは、従来のRAG(Retrieval-Augmented Generation)の限界を突破する全く新しい知識管理手法だ。この提案はHacker Newsで1000以上のupvoteを獲得し、「これはゲームチェンジャーだ」「まさに欲しかった機能」といった熱い反響を呼んでいる。 一般的なRAGでは、文書をベクトル化してクエリ時に関連断片を検索し、LLMが毎回ゼロから回答を生成する。しかし「LLMが毎回同じ知識を再発見している」という根本的な非効率性がある。5つの論文を総合判断する複雑な質問でも、LLMは毎回同じ推論を繰り返すことになる。 「wikiをLLMが自動管理」という
本記事では、エンジニアがつくってきた“自分仕様のAIツール”や“AI活用術”をご紹介します。エージェントやBot、LLM連携ツールなど、実用的なものから、ちょっと遊び心のあるものまで。プロンプト設計やUIの工夫、うまくいかなかったことや思いがけない発見を通して、AIとの付き合い方をのぞいていきます。AIをどう使うかだけでなく、どんな距離感で付き合っているのか。誰かのAIとの向き合い方が、あなたとAIのちょうどいい“さじ加減”の手がかりに。 どうもお疲れさまです、株式会社エクスプラザでCPOをやっています、みやっち(X: @miyatti)です。「生成AIエバンジェリスト」という肩書きで、普段はAIを使ったプロダクトマネジメントの実践や発信をしています。 AIを仕事に取り入れ始めて約1年。やればやるほど、「どこまでAIに任せて、どこで人間が判断するか」という問いにぶつかります。今回は、その試
Claude Codeを使っていて「あ、今の指示ミスった」「さっきの会話に戻りたい」「MCPって何が起きてるの?」と思ったことはありませんか? この記事では、Claude Codeの会話管理・MCP・プランモード・並列作業まで、開発者が知っておくべき機能を網羅的にまとめます。 Part 1: 会話の管理 1. Rewind(巻き戻し)— Esc Esc 一番使う機能。 ノイズを入れてしまった会話を「なかったこと」にできます。 やり方 Esc を2回押す。それだけ。 確認画面が出る Rewind Confirm you want to restore to the point before you sent this message: > 小さく試した。おすすめの進め方を教えて欲しい > (6m ago) The conversation will be forked. The code w
環境設定から並列セッションでのスケーリングまで、Claude Code を最大限に活用するためのヒントとパターン。 Claude Code は agentic coding 環境です。質問に答えて待つチャットボットとは異なり、Claude Code はファイルを読み取り、コマンドを実行し、変更を加え、あなたが見守ったり、方向を変えたり、完全に任せたりしながら、自律的に問題を解決できます。 これはあなたの作業方法を変えます。自分でコードを書いて Claude にレビューしてもらう代わりに、やりたいことを説明すると Claude がそれをどのように構築するかを考え出します。Claude は探索し、計画し、実装します。 しかし、この自律性にも学習曲線があります。Claude は理解する必要がある特定の制約の中で動作します。 このガイドでは、Anthropic の内部チームと、様々なコードベース、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く