サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
セキュリティ
zenn.dev/lecto
はじめに 画像やPDFのテキストをコピーしたいとき、オンラインのOCRサービスに画像を送るのはちょっと抵抗がありませんか? 特に社外秘の資料や個人情報が写っている場合。 通信ゼロ、ブラウザの中だけで完結するOCR があれば安心して使えるのに — そう思って、Chrome拡張機能を作りました。 以前からいくつかの日本語OCRを試してきて、ブラウザ内でも実用レベルで動くことがわかっていたので、それを誰でも気軽に使える形にしたかったのが動機です。 yomitokuで作る日本語OCR Webアプリ — サーバーサイドで高精度な日本語OCR Tesseract.jsでカスタムモデルのトレーニング — ブラウザOCRの可能性と限界 ブラウザだけで完結する日本語OCR+透視変換 — NDLOCRをブラウザで動かす Chrome Web Store で「オフラインOCR」と検索してもヒットします。 これま
zenn.dev/ashunar0
はじめに 本日、Hono の作者 yusukebe さん から @hono/inertia が正式リリースされた。 前回、サンプルアプリの中身を除いて、Hono と Inertia.js の型貫通体験の仕組みを明らかにしたところで、今回は実際に簡単あアプリを作って、その触り心地を確かめてみる。 前回の記事 今回作ったアプリ 結論から言うと、SPA の書き心地が一段階アップデートされる体験だった。ふだん React + API で書いていた時のしんどさが、けっこうな部分まるっと消える。具体的には: API エンドポイントを書かなくていい React Router が要らない useEffect + fetch のお作法が消える 取得データ用の useState も要らない 以下、何が嬉しかったのかを、実装しながら掴んだ感覚で書く。 この記事で扱うこと @hono/inertia で何ができる
zenn.dev/layerx
Claude / CodexのPermission確認をLLMに代行させるccgateというCLIを作った もとはAuto Mode的な体験を目指して作り、Auto Modeが使えるようになった今もPlan mode中の確認やCodexへの展開、ログ・metricsの可視化のために使い続けている 自分の環境では1ヶ月約2000件のPermission確認のうち、基本的に97%近くが自動化された はじめに こんにちは。@tak848です。今日で25になりました。もうアラサーってやつなんでしょうか。 みなさん、Coding Agentは使っていますか? 個人的には、個人開発でも業務でもClaude CodeやCodex CLIが欠かせない道具になっています。使う時間が増えるほど、Tool実行のPermission許可で止まる場面も増えてきました。 とはいえ、面倒だからといって--dangero
皆さん、こんにちは。sotamakiと申します。 今日は、主にAIエージェント文脈で登場するサンドボックスについて学んだことをまとめていきたいと思います。 前提:AIエージェントは”行動”する 最近のAIエージェントは、単に文章を生成するだけでなく、コードを書いて実行し、ブラウザを操作し、外部APIを叩き、ファイルを読み書きします。指示を受け取り、自ら判断しながら一連の操作を完結させます。 ユーザー入力 ↓ ┌─► LLM(思考・計画) │ ↓ tool call │ 外部ツール / API / コマンド │ ↓ └── 結果フィードバック ↓ 最終応答 この「自律的にツールを呼び出せる」という特性が、従来のWebアプリとは異なるリスクを生む可能性があります。 通常のアプリは「受け取った入力をどう処理するか」をコードに書きますが、エージェントは「何を実行するか」をLLMが動的に決めます。攻
zenn.dev/knowledgesense
本記事では、RAGの性能を高めるための「Corpus2Skill」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、「ベクトルDB」を使わずにRAGの精度を上げる新手法「Corpus2Skill」の論文[1]について、日本語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます(参考) 本題 ざっくりサマリー 「Corpus2Skill」は、ベクトルDBを使わず、エージェンティックに検索することで、RAGの精度を上げます。 Magellan Technology Research Institute (MTRI) の研究者らによって2026年4月に提案されました。 通常のRAGでは、文章をベクトル
zenn.dev/nttdata_tech
実際の画面とは異なるサンプルイメージです チームのSlackにAI社員を3人常駐させています。 社員5人で、2週間動かしました。 誤解を招きそうだからちゃんと書いておきます。 2週間です。半年でも1年でもなく、2週間。 それでも書きたくなるくらいのことが起きたので、この記事を書いています。 SIerの大規模開発で扱う資料は毎週溜まります。 仕様書の背景、顧客の痛点、過去の判断の残り香。 新しく参画したメンバーは、これを数週間かけて読み込むのがいつもの景色です。 そこに、このAI社員3人が入りました。 すると、2年目のメンバーが参画1週間でSKILLを直し、2週間で設計根本に疑問を出してきた。 正直、びびりました。 自己紹介・大規模現場の話を軽く 私はNTTデータグループ 技術革新統括本部のITアーキテクト(課長代理)で、大規模システムのモダナイゼーションに携わっています。 全社の高難度案件
zenn.dev/bilzard
はじめに この記事ではエンジニアが30%~40%とキー数の極端に少ないレイアウトにする場合の注意点についてまとめました。 用語について ShiftやCtrlといった「修飾キー」と、記号などを打つための「レイヤー切り替えキー」は、どちらも「他のキーと組み合わせて別の機能を持たせる」という点で本質的に同じものです。この記事では、これらをまとめて Metaキー と呼ぶことにします。 40%レイアウトの基本ルール 結論を先に言うと、 日常的にコマンドを叩くような作業をするエンジニアは5カラムなど極限までキー数を削ったキーボード配置に安易に移行するのは推奨しない というのが主な主張です。もちろんそれでうまくいっている人は全然問題ないです。これから40%キーボードを検討しようとしている人に向けて、私自身がつまずいた内容を共有することが目的です。 主張したい点は以下です。 親指のホールドキーの割当は最小
zenn.dev/yamadashy
Claude Codeのルーチン(Routines)機能を、何に使うのが良いのかしばらく考えていました。 クラウド上でプロンプトを定期実行できる便利な機能なのですが、定期的に動かして意味のあるタスクは何だろう、と。 たどり着いたのが、パフォーマンスチューニングです。 「速くなったか」は数値で判断できるので、ベンチマーク基盤さえあれば、あとはAIに任せられます。 機能としてデグレしていないかもテストが充実していれば自動で確認できますし、ブランチを切って進めるので本流には影響しません。設計の創造性があまり要らないのもAIに任せやすいところですね。 私が開発しているRepomixというCLIで試してみたところ、実行速度が 約2.4倍 になりました。 ある程度再現性のある形に落ち着いてきたので、プロンプトとベンチマーク基盤の話を中心に共有します。 ルーチンとは Claude Codeには、クラウド
// サーバー側(Hono) app.get('/posts/:id', (c) => { const post = findPost(c.req.param('id')) return c.render('Posts/Show', { post }) }) // クライアント側(React) export default function Show({ post }: PageProps<'Posts/Show'>) { return <h1>{post.title}</h1> } post の型は Post として完全に推論される。間に API 定義も DTO も tRPC もスキーマ生成もない。サーバーで c.render() の第2引数に渡したオブジェクトが、そのまま React の props として、しかも完全に型付きで届く。 「API なし SPA」を謳う Inertia.j
1. はじめに 今回は、MCP 初心者が MCP サーバを試してみて考えたこと・気づいたことを紹介しようと思います。 MCP は概要だけ知っていたものの今まで使ったことがなかったのですが、GitHub Copilot(筆者は VS Code で利用)の Agent モードを活用すれば簡単に環境を作って試せるのではないかと思いつきました。 そこで、馴染みのないツールの MCP サーバでも手軽に試すことができたら良いなと思い、初めて触る Playwright を用いて UI/UX レビュー&修正のサイクルを自動化させてみました。 なお、この試みの中で私は1行もコードやプロンプトは書いていません。書いたことと言えば、チャットで自分の意向を伝えたくらいです。 ただし、本記事では、MCP サーバを使う上で学んだことがメインテーマなので、UI/UX のレビューでどういった指摘が出て、どういった修正がさ
zenn.dev/aircloset
みなさまこんにちは!エアークローゼットでCTOをしている辻です。 これまでに DB Graph MCP、社内MCP群の全体像、Biz Graph MCP と、社内向けに作っている MCP サーバーを順に紹介してきました。 今回はその中でもちょっと毛色が違うものを取り上げます。Sandbox MCP ── 非エンジニアの社員が AI と一緒に作ったアプリを、ワンコマンドで社内に安全に公開できるプラットフォームです。 「Claude Code でアプリを作れるなら、それをそのまま社内に出せばいいじゃん」という話を、安全に実現する仕組みです。 背景:作るのは簡単になったが、公開は難しいまま Claude Code をはじめとする AI コーディングエージェントの普及で、いま社内の景色が大きく変わりつつあります。 これまで「アプリを作る」と言うと、エンジニアの仕事でした。要件定義してデザインを起こ
zenn.dev/nijima
はじめに 「どのフレームワークを選ぶべきか?」 これは初学者だけでなく、新規事業の技術選定を任された中級者にとっても常に悩ましいテーマです。 いまフロントエンドの世界は、大きな転換期を迎えています。長年使われてきたReact、Vue、Angularの三大フレームワークが、これまでの古い常識を捨てて新しい次元へとアップデートしているからです。さらに忘れてはいけないのが、私たちのすぐ隣には「Claude Code」や「Cursor」のような、最強のAIアシスタントが当たり前のように存在しているということです。 この記事では、初学者が最初のステップを踏み出すための視点から、中級者がモダンなアーキテクチャをどう捉え、AIとどう協業していくべきかまで、各フレームワークの現在地をまとめました。 1. React:サーバー主導UIへの移行と「AIエコシステムの覇者」 現在もフロントエンド業界で圧倒的なシ
zenn.dev/acntechjp
この記事はAIの支援を受けて執筆しています。 はじめに 「Claude にコードを書かせ、Codex にレビューさせる」という構成は、異なるモデルによる外部視点が得られるとして注目されています。この組み合わせ自体はシンプルですが、実際に運用しようとすると 「どうやって2つのモデルをつなぐか」 というハーネス選びが課題になります。 いくつかのオーケストレーションツールを検討した中で、もう一つ制約がありました。手元の環境では Codex の API を直接呼び出せず、GitHub Copilot 経由でのみ Codex が使える状況だったのです。 この条件にマッチしたのが takt です。takt は Claude と Copilot を同じワークフロー内のステップに混在させられるため、今回の構成にそのまま当てはめることができました。 この記事では、takt を使ってこのワークフローを組む方法
zenn.dev/ykob
アプリケーション開発の現場において、デザイナーによって作成されたFigmaなどのUIデザインがいざ実装フェーズに入ると、「このボタン、この状態ではどう動くの?」といった情報の不足が見つかったり、「裏側のデータ構造と合わない」といった手戻りが発生したりと、職種間のコミュニケーションミスが発生したことはないでしょうか。それは、開発の現場において「ビュー(見た目)」という表面的な情報を起点にデザインすることが常態化しているからかもしれません。本稿では、オブジェクト(実体)を起点にUIを設計することで、デザイナーと開発者が迷わずに進める「共通の地図」を作るアプローチについて解説します。 参考書籍 本稿の作成においては以下の書籍を参考にしました。 オブジェクト指向UIデザイン | 技術評論社 モデルベースUIデザイン 構造化UIと情報設計の方法論(丸 怜里)|翔泳社の本 Lean UX 第3版 -
zenn.dev/bizreach_aps
はじめに こんにちは、uchiです。株式会社ビズリーチのAI Product Studio(以下、APS)でエンジニアをしています。APSは2026年2月に新設された組織で、「AIでプロダクト創出を常態化する」をミッションに、現在はAIを前提とした開発プロセスの構築と新規プロダクト開発に取り組んでいます。 この記事では、APSでAI前提の開発フローを構築するなかで生まれた「Agentic UATスキル」を紹介します。AIエージェントに仕様を一切教えずエンドユーザーを演じさせ、業務を遂行できるかを自律的にテストする手法です。ソースコードを読ませず、UIだけを頼りに業務を進めさせることで、「テストは通るのにエンドユーザー視点では動かない」バグを人手を介さずに検出できるようになりました。 AIエージェントに実装全体を任せたある時、こんな事象が発生しました。 「ユーザーのステータス変更機能を実装し
zenn.dev/mkj
松尾研究所シニアデータサイエンティストの太田です。普段はLLMの事後学習に関するプロジェクトに携わっています。 現在松尾研究所では各種業務をメンバーに代わって自律的に代行するパーソナルエージェントの社内開発に取り組んでいます。この記事ではそうした開発のなかで調査をしたOpenClawとHermesについて、思想の違いとデザインチョイスを主に共有したいと思います。 Claw とは 2025年11月にGitHubで公開されたOpenClaw(当時はClawdBot)は瞬く間に同プラットフォームで250k Star(React以上)を記録しました。 OpenClawの注目の理由は従来エージェントがリアクティブ(ユーザーからの指示を経て行動する)だったことに対して、常時起動とCronジョブを取り入れることで、アクセシビリティとプロアクティブ性(エージェントが自ら行動する)を見せたことにあります。一
zenn.dev/sasau
大規模言語モデル(LLM)を中心とした生成AIの出現に伴い社会が作り変えられつつある。個人的な感覚としてはAIベンダーがリリースする定期的なモデルの刷新は2023年のGPT-4から本質的な変化はないと思っていた。だが、2025年末からのClaude Codeを先頭にした性能向上や、多様な角度での機能の拡充などが、複合的に作用しあい、2025年末以降、本格的な動きとなっている。 我々にとって生成AIは最初の1、2年はチャットを通して新しい独白、つまり内面世界を拡張するものとして、半ば暗黙的な存在のように扱われてきた。しかし、APIやプラグインの充実により、スタンドアロン性が強かったWordやExcel、そしてコードエディタとも接続されるようになった。 独白の延長であったならば、AIの出力がどんなに優れていようともーー逆にハルシネーションを含んだものであったとしてもーーそれをどのように扱うかは
zenn.dev/tomokusaba
はじめに GitHub Copilot CLI で複数のエージェントを使って成果物を改善するワークフローを考えていると、最初に悩むのが「誰が成果物を書き換えるのか」です。 私も最初は、執筆役が初稿を書き、その後に事実確認役、表現レビュー役、構成レビュー役が順番に本文を確認する流れを考えていました。これは逐次型のワークフローです。 一見すると自然な分担です。専門エージェントが順番に成果物を改善していくので、レビュー観点も漏れにくそうに見えます。 しかし、並列実行を前提に考えると、この設計はかなり相性が悪いことに気づきました。理由はシンプルで、複数のエージェントが同じ本文を書き換えるからです。 この記事では、GitHub Copilot CLI で複数エージェントを扱うときの考え方として、同じ成果物を安全に改善するための設計を整理します。ブログ記事執筆は、あくまで題材として扱います。具体的には
zenn.dev/yagisan_reports
デンキヤギでは、2021年から 商用の帳票エンジン(yagisan-reports) を開発しています。 この間に 生成AIにプログラムを書かせることが当たり前 になりました。この流れに追従するため、 帳票エンジンの開発方針を生成AIに全振りして、4年以上取り組んでいた帳票デザイナーの開発を凍結する 決定をしました。 なお、この記事は2年半ぐらい前に書いた記事の続編です。 開発当初(2021年、AI以前)からの構想 yagisan-reportsは最初期から、 帳票テンプレートは人間が読みやすく、手書きできる ことを設計方針の軸の一つにしていました。その結果として、帳票テンプレートはJSXやXAMLなどに似た宣言的なXML形式となっています。 とはいえ、商用製品として売るためには「GUIの帳票デザイナー」が必要不可欠 であるとも考えていて、実際にかなりの初期段階から開発を進めていました。こ
zenn.dev/lixian
テキストでなくKVで注入する:KVIがRAGの構造的限界を突破する理由 TL;DR RAGの根本問題:外部知識はテキストトークンとして注入されるため、モデルのパラメトリックKV記憶と構造的に対等な地位を持てない Knowledge Capsules:文書コーパスから抽出した関係知識(S, R, O, I)を、凍結LLMでKVテンソルに事前コンパイルする非パラメトリック記憶ユニット KVIフレームワーク:コンパイル済みKVをアテンションキャッシュに直接注入し、外部知識がモデル内部の記憶と同等にsoftmax競争に参加できるようにする 一貫してSOTA:NQ、HotpotQA、MedHopQAでRAGとGraphRAGを上回り、特に多段推論ではGraphRAG比+12.1%〜+146.7% 重要な知見:グラフ検索を外すと多段タスクで壊滅的性能低下(-100%)。KV注入の単体では不十分で、構造
zenn.dev/k_sak
はじめに 本記事で紹介するエージェントのリポジトリはこちら: 今回私が作成したAIエージェントについて書きます ソフトウェアテストに関するエージェントです VSCode上のgithub Copilotでの対話で動きます いわゆるリグレッションテストの文脈ではありません 一定の観点に沿ったテストだけでなく、発見した「怪しいところ」からテストを広げます シゴデキなテスターがJoinしたかのような錯覚を覚えました 特にテスト結果レポートqa-explorer-report-hotel-20260424.html。AIがテストを進めながら「ここ怪しいかも?」と切り分けてテストを進めてくれました。 AIにテストさせると「浅くなる」問題 上記の記事でも書いたが、各テストプロセスでAIに中間成果物を作らせたことで、 人間側の理解がかなり浅くなってしまい、空白領域ができた。 また、生成AIを使ってテストを
zenn.dev/dress_code
はじめに こんにちは。Dress Code 株式会社で、プロダクトエンジニアをやっている津田です。 仕様駆動開発を始めて 4 ヶ月ほど経過したので、改めて振り返ってみるべく記事に残してみています。 今回の対象読者は次に列挙するような方々を想定しています。 とりあえず試して実感してみたい人 プロセスが重そうで踏み出しきれない人 現場での工夫・実践知を知りたい人 本記事がこれらの方の一助になれば幸いです。 正直、仕様駆動開発自体の合う合わないは組織の規模やプロダクトの性質、開発スタイルに強く依存すると考えています。 参考程度に弊社の情報を軽くお伝えすると、次のようになっております。 創業から1年経過し、拡大を目指しているフェーズ toB向け、バックオフィスの業務改善のSaaSを展開 開発スタイルはアジャイルに近い 開発者は執筆時点で12名、組織全体で40名弱の規模感 少なくとも我々はこのような
zenn.dev/geeknees
RubyKaigi 2026 に参加して、Matz のキーノートで Spinel の発表を聞きました。Spinel は Ruby の AOT コンパイラで、Ruby のコードを読み、C のコードを生成し、最後は native binary として実行できる形にします。Ruby を書いている人間としては、「Ruby の AOT コンパイラ」という言葉だけでテンションが上がります。 Ruby はかなり動的な言語でもあります。メソッド呼び出し、クラスの再オープン、メタプログラミング、eval、実行時に変わるオブジェクトの形。普通に考えると、AOT コンパイルとは相性が悪そうに見えます。 それでも Spinel は、Ruby を Prism で parse し、AST をもとに型推論し、C のコードを生成して native binary にします。発表を聞いていて、これは触ってみたいなと思いました
zenn.dev/xxishan
AnthropicがClaude CodeをProプラン($20)の機能一覧から削除し、Maxプラン以上($100〜)でしか使えなくなったように見えたことが先日話題になりましたね! そうでなくても時間や週間単位の利用制限などで、Proプランで抑えめ抑えめに利用している開発者の方も多いと思います。 そんなClaude Codeに対して現在精力的に開発・機能追加が行われているのがOpenCodeです。 今回TUI版のOpenCodeを導入して試してみたので、Claude Codeとの比較とともに紹介したいと思います。 OpenCodeとは OpenCodeはもともとClaude CodeのOSS版という位置づけで、自分でAPIキーを設定して使うCLIツールとして出発しました。 その後、最先端AIモデルを手軽に利用できるOpenCode Zenや、最安月額$5からのサブスクリプションサービスOp
zenn.dev/shinagawa_web
クエリが遅くなった。直そう。ここから問題が始まる プロジェクト管理SaaSを1年ほど運用すると、Issueテーブルが200万行、変更ログテーブルが2000万行を超えてくる。ソフトデリートを採用していれば物理削除されないので、行数は増える一方だ。 最初の兆候はユーザーからの報告だった。「Issue一覧の読み込みが遅くて、フィルターを切り替えるたびに5秒くらい待たされるんですが」。スロークエリログを見ると、フィルター付きのIssue一覧クエリがp95で3秒を超えている。インデックスを追加すれば改善する。スキーマ変更も1つ控えていた。どちらもやること自体は明確だった。 問題は「200万行のテーブルにDDLを打つ」という行為そのものにあった。膨れ上がったテーブルに対するスキーマ変更は、パフォーマンスを改善するための作業が、新たな障害を引き起こす可能性を持っている。治療のための手術が患者を殺しかねな
zenn.dev/yuichirominato
「石の上にも三年」「まずは現場の苦労を知れ」——。 そんな耳にタコができるほど聞かされてきたアドバイスを、今すぐゴミ箱に捨てるところから始めよう。 今の日本を覆っているのは、過去の成功体験という名の「重石」だ。高度経済成長期のルールで動いている人たちに、指数関数的に進化するデジタル経済の歩き方がわかるはずもない。 若者が今すべきことは、上の世代に評価されることではない。ITという武器を手に、彼らが想像すらできないスケールで「稼ぐ」ことだ。 1. 「改善」ではなく「破壊と創造」に張れ 既存の産業の効率化を助けるだけの「下請けIT」で満足してはいけない。それは結局、古い構造を延命させているに過ぎない。 私たちがやるべきは、古い産業そのものをテクノロジーでリプレイスすることだ。 物理的な制約をソフトウェアで突破する。 中間搾取が発生している不透明な市場をアルゴリズムで透明化する。 「職人の勘」を
zenn.dev/lluminai_tech
はじめに こんにちは! ルミナイR&Dチームの宮脇彰梧です。 現在はマルチモーダルAIの研究を行う大学院生として、 生成AIやAIエージェントの技術を実践的に探求しています。 最近、RAGの実装をしていて、こんな悩みはありませんか? 「ドキュメント全体を理解していないと答えられない質問(要約や関係性など)が来ると、検索キーワードがうまく作れずに精度が落ちる…」 「かといって、Gemini 3 Proのようなロングコンテキストモデルに全部突っ込むと、コストも高いし推論も遅い…」 今回紹介する MemoRAG は、まさにそのジレンマを解決するために現れた、「記憶(Memory)」 という概念を取り入れた新しいフレームワークです。 この記事で学べること 従来のRAGが苦手とする「曖昧なクエリ」をMemoRAGがどう解決するか Global Memory と Dual-System アーキテクチャ
zenn.dev/alarky
CGI は本当に死んだのか? CGI と聞いて何を思い浮かべますか。Perl のアクセスカウンター、掲示板スクリプト、cgi-bin ディレクトリ——2000年代の Web 開発を支えた技術ですが、今ではレガシーの代名詞のように扱われています。Ruby 4.0 では cgi が標準ライブラリから削除されるなど、言語レベルで CGI から離れる動きもあります。 しかし CGI という仕組み自体は死んでいません。Apache は今も CGI をサポートしていますし、レンタルサーバーでは当たり前に使えます。Go は net/http/cgi を標準ライブラリで提供しており、同じ http.Handler が CGI でもスタンドアロンサーバーでもそのまま動きます。 Go のシングルバイナリと SQLite を組み合わせると、CGI は再び実用的な選択肢になります。この記事では、実際に CGI 上
zenn.dev/microsoft
Azure SRE エージェントは、Microsoft が提供する運用支援サービスです。障害対応や定期タスクを AI エージェントが補助してくれます。 インシデント対応での文脈で取り上げられることが多い SRE エージェントですが、応用の可能性は多岐にわたります。これは、SRE エージェントが以下のような能力を持つためです。 サンドボックス環境で Python や Azure CLI などの任意コマンドを実行する MCP(stdio/http)で外部サービスと連携する インシデント管理ツールや HTTP(webhook)をトリガーにして作業を開始する つまり、これらの機能をうまく活用すればなんでもできる、ということで、今回は パフォーマンス チューニング に取り組んでもらうことにしました。 お題は ISUCON13 パフォーマンスチューニングと言えば、ISUCON が有名です。決められたレ
次のページ
このページを最初にブックマークしてみませんか?
『Zenn|エンジニアのための情報共有コミュニティ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く