yusuke-kのブックマーク - はてなブックマーク

国立国会図書館のOCR技術を使って、完全オフラインOCRのChrome拡張を作ってみた

はじめに画像やPDFのテキストをコピーしたいとき、オンラインのOCRサービスに画像を送るのはちょっと抵抗がありませんか？特に社外秘の資料や個人情報が写っている場合。通信ゼロ、ブラウザの中だけで完結するOCR があれば安心して使えるのに — そう思って、Chrome 拡張機能を作りました。以前からいくつかの日本語OCRを試してきて、ブラウザ内でも実用レベルで動くことがわかっていたので、それを誰でも気軽に使える形にしたかったのが動機です。 yomitokuで作る日本語OCR Webアプリ — サーバーサイドで高精度な日本語OCR Tesseract.jsでカスタムモデルのトレーニング — ブラウザOCRの可能性と限界ブラウザだけで完結する日本語OCR＋透視変換 — NDLOCRをブラウザで動かす Chrome Web Store で「オフラインOCR」と検索してもヒットします。これま

yusuke-k 2026/04/29

web
code

リンク

LLMをもっと賢くする：ナレッジグラフ実践入門

「ChatGPTは賢いのに、なぜ業務では使いにくいのか」。その答えがナレッジグラフにあります。本書は、RAGだけでは解けない問題の正体を明らかにし、ナレッジグラフがLLMに何をもたらすかを、入門から世界の活用事例、実装アーキテクチャ、AI Agentとの統合まで一気通貫で解説します。エンタープライズ規模でのKG実装は難しい。だからこそ、何が難しいのかを正確に理解することが第一歩です。

yusuke-k 2026/03/22

AI
code

リンク

チームみらいは誰の声を聞いているのか——オードリー・タンとの分岐点

テックライト——テクノロジーへの絶対的信頼と右派的政治観を結合した潮流。ベンチャーキャピタリストのマーク・アンドリーセンは2023年に投稿した「テクノロジー楽観主義者のマニフェスト」という文章の中で「We believe」を113回繰り返し、加速主義の父ニック・ランドとイタリア未来派の主導者である詩人F・T・マリネッティを「守護聖人」として挙げた[4]。シリコンバレーの投資家ピーター・ティールは「民主主義と自由は両立しない」と公言し、海上に人工島を建てて既存国家の法から逃れる構想に出資し、トランプ政権ではJ・D・ヴァンスを副大統領候補に押し上げた。テクノロジーで民主主義を迂回するか、政治権力そのものを握るか——手段は変わっても、選挙で決まるルールに縛られたくないという志向は一貫している[5]。歴史家スザンヌ・シュナイダーはこの潮流に対して、ヤニス・バルファキスらの提唱した「テクノ封建制」概

yusuke-k 2026/02/07

オードリー・タンを神格化し過ぎでは？台湾の大臣と日本の政党は適切な比較対象になるのか

リンク

Anthropicハッカソン優勝者のClaude Code設定集「everything-claude-code」を読み解く

Anthropicハッカソン優勝者が10ヶ月以上かけて実際のプロダクト開発で使い込んだ everything-claude-code というリポジトリが公開されていたので、内容を読み解いてみました。この記事の要約 Anthropic x Forum Venturesハッカソン優勝者が公開した本番環境で使えるClaude Code設定集 agents, skills, hooks, commands, rules, MCP設定の6種類のファイルで構成コンテキストウィンドウは 200kから70kまで縮小する可能性があるため、MCPの有効化は10個以下に抑える TDD（テスト駆動開発）を中心にしたワークフローで、カバレッジ80%以上を必須とする /tddや/planなどのスラッシュコマンドで素早くワークフローを呼び出せる hooksによる自動化でフォーマット実行やconsole

yusuke-k 2026/01/20

code
AI

リンク

コーディングエージェントにやさしい環境は、人間にも優しかった ghq × gwq × fzf のススメ

こんにちは @shunk031 です。業務や趣味に git clone 等でレポジトリが増えると、どこに clone したか・どこで作業しているかが分かりにくくなり、cd や補完に時間を取られがちですよね。さらに開発のためにブランチを切ったり、Pull Request のレビューのために別ブランチをチェックアウトしたりすると、切り替えや stash の手間がどんどん増えます。私はよくブランチの切り替えをミスってコンフリクトを起こしたり、変更を失いかけたりしています。こうした問題は Claude Code や Codex のようなコーディングエージェントを使い始めると更に露呈します。複数タスクを並列に走らせるほど、作業ディレクトリが 1 つだと衝突しやすいからです。コーディングエージェントなんてなんぼでもしばきたいですよネ。本記事では、以下の 3 つのツールを組み合わせて日々の開発をさら

yusuke-k 2026/01/13

code
AI

リンク

「そもそも生成AIでやるべきでない問い」に、企業が挑んでしまう問題｜深津貴之 (fladdict)

わりと複数の企業のお悩みが、「そもそも生成AIでやるべきでない問い」にチャレンジして疲弊してる。ので説明メモ。大企業が生成AIを導入してうまくいかないケースの多くは、ツールの性能不足というより、業務設計がズレている印象があります。もう少し正確に言うと、「AIが苦手な問い」をそのまま投げている。で、当然苦戦しています。ポイントは大きく2つあります。完璧性を要求する仕事を、やってはいけないステップが長く連鎖する仕事も、やらせないほうがいい順番に解説すると… そもそも完璧性を要求する仕事を、やってはいけない生成AIは確率分布で、未来を予測したり、答えを予測するマシーンです。つまり、「確率的に間違えが発生する」ことは仕様の一部です。なので、以下のような「そもそも100%の正しさを前提とする業務は苦手」です。正解が一意で厳密：数式の厳密計算、機械語や厳密仕様のコード生成（1文字違いで

yusuke-k 2026/01/10

AI

リンク

フェルメール展公式サイト

オランダの黄金時代の美術を代表する画家フェルメール(1632～75)の最高傑作の1つ、オランダのマウリッツハイス美術館の至宝《真珠の耳飾りの少女》の来日が決定。8月21日から9月27日まで、大阪中之島美術館で展覧会を開催。《真珠の耳飾りの少女》は、約120万人を動員した2012年の「マウリッツハイス美術館展」（朝日新聞社など主催）以来、実に14年ぶりの日本での公開。マウリッツハイス美術館のマルティネ・ゴッセリンク館長は「この《少女》の旅は、日本の皆さまに彼女を送り届けられる、おそらくは最後となるであろう特別な機会です」と話す。この貴重な機会をどうぞお見逃しなく！ヨハネス・フェルメール（1632-1675）美術の黄金時代であった17世紀オランダを代表する画家の一人であり、静謐な日常生活の情景を精緻に描いた作品で知られる。制作に関しては一枚の絵に長い時間を費やしたため、完成させた作

yusuke-k 2026/01/09

art

リンク

Claude Codeの Agent Skills は設定したほうがいい - じゃあ、おうちで学べる

Claude Codeを使い始めて、様々な発信をしてきました。今回は「Agent Skills」について。これも設定しておくと、Claude Codeがグッと使いやすくなる機能です。 Claude Code の settings.json は設定した方がいい - じゃあ、おうちで学べる Claude Code の CLAUDE.mdは設定した方がいい - じゃあ、おうちで学べる Claude Code の .claude/commands/**.md は設定した方がいい - じゃあ、おうちで学べる Claude CodeのHooksは設定したほうがいい - じゃあ、おうちで学べる Claude CodeのSubagentsは設定したほうがいい - じゃあ、おうちで学べるはじめに「このプロジェクトではpython-pptxを使ってスライドを作って」「SQLは必ずこのフォーマットで書いて」

yusuke-k 2025/12/20

code
AI

リンク

Claude CodeからPull Requestのレビュー操作を便利に行うClaude Skillsを作った - $shibayu36->blog;

Claude CodeやClaude Code Actionを用いて、AIに自律的にPull Requestのレビューを行なってもらうとき、いくつかの課題があった。その解決のためにPull Requestのレビュー操作に特化したgithub-pr-review-operationというClaude Skillsを作ったので紹介します。課題次の3つの課題があった。インラインコメントを付ける時に、コメントする行を間違える Claude Code ActionにはインラインコメントをつけるMCPが同梱されているが、ある行に対する指摘内容を別の行にコメントを付けることが多かったそのPull Requestに過去ついたコメントを考慮してと指定しても、うまくコメント一覧を取得できない通常のコメントは取得できてもインラインコメントは取得せずに進めてしまうなどそのPull Requestについ

yusuke-k 2025/12/18

code
AI

リンク

初心者が爆速で Claude Code を習得する 10 のステップ

その②：通知をONにするモデルが強化されるにつれて、長時間の作業を自律的に行えるようになっています。その間、人間がずっと見ている必要はないため、作業が終わったら通知で連絡をもらうように設定しましょう。個人的に参考になったブログはこちらです。その③：音声入力を活用する音声入力なら、タイピングの 3 〜 4 倍の情報量を、背景や意図を含めて自然に伝えられます。入力の負担が減って思考に集中できます。個人的に参考になった動画はこちらです。 2. CLAUDE.md を作成し、育てる CLAUDE.md とは？ CLAUDE.md は、Claude にプロジェクトの背景知識（コンテキスト）を持たせるための設定ファイルです。通常、AI は会話のたびにプロジェクトの構成やルール（コーディング規約など）を忘れてしまうため、毎回説明する必要があります。しかし、プロジェクトのルートディレクトリに C

yusuke-k 2025/12/04

code

リンク

OCR技術の変遷と日本語対応モデルの性能検証 - LayerX エンジニアブログ

こんにちは、バクラク事業部AI・機械学習部の飯田 (@frkake) です。こちらはLayerXアドベントカレンダー1日目の記事です。初日は @izumin5210 さんの記事との二本立てです。最近、DeepSeek-OCRの登場など、OCR界隈がにわかに活気づいていますね。LLMやVLMの進化に伴い、OCRも単なる「文字起こし」から「構造の読み取り」、さらには「内容の理解」へと進化しているのを感じます。そこで本記事では、改めてOCR技術の変遷を振り返りつつ、各モデルを自作のサンプルデータを使って検証してみたいと思います。本記事での用語の整理をあらかじめしておきます。テキスト認識：それがなんの文字であるのかを特定すること。文字起こしを行うことテキスト検出：文字の位置を検出することレイアウト認識：画像中の要素の位置や配置を認識すること OCR：画像から文字を書き起こすことドキ

yusuke-k 2025/12/02

code
AI

リンク

1Password Environmentsで.envファイルを管理できるようになったので試してみた | DevelopersIO

iOS開発において、APIキーやFirebaseの設定情報などのシークレット情報を管理するのは重要な課題だ。多くの開発者が.envファイルを使って環境変数を管理しているが、平文でディスクに保存されるため、うっかりGitにコミットしてしまうリスクが常につきまとう。私はArkanaを使ってシークレット情報を難読化しているが（Arkanaについての詳細は以前の記事を参照）、その元となる.envファイルの管理には課題があった。 2025年10月、1Passwordの新機能「1Password Environments」がパブリックベータとしてリリースされた。この機能を使うと、.envファイルを仮想的にマウントし、シークレット情報をディスクに書き込まずに管理できる。本記事では、1Password EnvironmentsとArkana、Xcode Cloudを組み合わせた運用方法を紹介する。検

yusuke-k 2025/11/23

リンク

ITベンダーの皆様、御社SaaSの導入を社内で止めていたのは、私です｜dx_note

はじめにITベンダーの皆様、申し訳ありません。この数ヶ月、何社もの「進捗どうですか?」というメールに対して、「社内で検討中」と返信して進めておりませんでした。御社の素晴らしいSaaSの導入を止めていた犯人は、私です。言い訳をすると、今日は、いろいろな仕事に追われていた。朝からDXのプロジェクトの進捗を見て、関係者に催促して、今度の対応事項をパワポに書いて。それから、WindowsXPのような見た目の社内システムで、交通費の精算。エクセルをプリントして印鑑を押して、領収書をのりで貼り付けて、経理まで提出。一発で承認が降りる人は、部署内でも少ないその後、懇親会のメールの作成。ccの順番は部署順か役職順か。日程調整は、エクセルでは失礼ではないか。そんな生産性とは無縁のことに頭を悩ませながら、時間が過ぎる。この状態で、御社からのメールを開く。「先日ご提案した件、ご検討状況はいかが

yusuke-k 2025/11/23

リンク

Apple、日本に緊急警告。「価格は下がらず利益86%が中国企業等へ」欧州DMAの皮肉な結末

Appleは、欧州のデジタル市場法(DMA)が当初の約束を大きく下回り、「消費者を危険にさらし、製品や機能を制限する結果を招いている」と警告した。来月12月18日に全面施行される日本のスマホ新法について、公正取引委員会との協議を続けているという。欧州でDMAが施行されてから約1年。Appleの新たな調査によると、開発者手数料が平均10ポイント引き下げられたにもかかわらず、90%以上の開発者が価格を据え置くか、むしろ値上げしている。その利益の86%以上がEU域外の企業に流出している。さらにiPhoneミラーリングやApple Intelligenceなどの新機能がEUでは提供できなかったり、遅延したりする事態が続いている。デジタル市場法（DMA）は、当初期待されていた成果を上げられておらず、欧州の消費者にとってはセキュリティやプライバシーの水準が低下し、ユーザー体験も悪化しています。本調

yusuke-k 2025/11/20

タイトルの「中国企業等へ」が、本文だと「おそらく中国」に変わってるのはどうなの…

リンク

「補給」や「戦力回復」がわからない、牟田口廉也のような親がいる

少し前のbooks&appsで、桃野泰徳さんが「娯楽も遊びも休息も、仕事の一部」という記事を書いてらしたのを覚えているだろうか。私はよく覚えている。なぜなら働いていくうえでとても重要な考えだと思うからだ。機械にメンテナンスが必要なのと同じく、人間には娯楽や遊びや休息が、つまり桃野さんの記事でいう「戦力回復」のフェーズが必要になる。それを怠っていれば仕事能力は次第に低下し、ときには健康を損ねてしまうかもしれない。だからマトモな組織や指揮官は「戦力回復」に十分な注意を払い、メンバーの福利厚生に努める。2004~2006年の陸上自衛隊イラク派遣に際し、厚生センターが現地に設営されたのもそのためだと桃野さんは書いてらっしゃる。牟田口廉也のインパール作戦ところが戦史を振り返ると、その「戦力回復」に注意を払っていないリーダーや指揮官が案外いたりする。太平洋戦争における旧日本軍は全体的にそうだ

yusuke-k 2025/11/18

牟田口廉也一人が悪いというより、牟田口を出世させてしまう旧日本軍という組織の問題も大きいと思う。そしてその組織的問題は現代でもあちこちに存在してる。

リンク

遊びながら「コード進行」を学べるゲーム『コード進行パズル』無料公開。すぐさま話題沸騰中 - AUTOMATON

音楽理論や奏法についての情報を発信しているずっしー氏は11月16日、『コード進行パズル』を公開した。本作はPC/iOS/Androidのブラウザ上で無料でプレイすることができ、公開されてからさっそく大きな話題となっている。『コード進行パズル』はパズルを通じて自然とコード進行に慣れ親しむことができるゲームである。プレイヤーはコード記号の書かれたブロックをつなげて消すことができ、ハイスコアを目指す。一度に多くのブロックをつなげるほど高い得点を獲得できるが、ブロックにはつながるものと、つながらないものが存在する。音楽において不自然なコード進行になってしまう場合はつなげることができないのだ。そのため本作ではパズルでハイスコアを目指すうちに、知らず知らずのうちに自然なコード進行が学べるというわけだ。ゲームは好きなキーとコード進行を選んでプレイすることになる。遊ぶことができるのはポップスなどで多用

yusuke-k 2025/11/18

リンク

How I Use Every Claude Code Feature

I use Claude Code. A lot. As a hobbyist, I run it in a VM several times a week on side projects, often with --dangerously-skip-permissions to vibe code whatever idea is on my mind. Professionally, part of my team builds the AI-IDE rules and tooling for our engineering team that consumes several billion tokens per month just for codegen. The CLI agent space is getting crowded and between Claude Cod

yusuke-k 2025/11/03

code

リンク

自己評価力を武器とする増補改訂版 | ドクセル

Fellow at Henry, Inc. Tech SaaSのPdM、スタートアップ取締役CTOや外資スタートアップのIC等を経て現任。好きな言語はGoとPerlと中国語で雑なOSSを200以上量産している。3 times ISUCON winner. 著書「みんなのGo言語」共著他。Podcast: https://oss4.fun/

yusuke-k 2025/10/29

仕事

リンク

マネージャーゼロでマネジメントする組織 - リーナー開発者ブログ

こんにちは、リーナーの id:yusuke-k です。リーナーのプロダクト開発の現場では基本的にマネージャーと言われる人がいません。なぜそうなっているか、という話を書いてます。この記事はながらRuby会議01 で登壇したスポンサーLTを元に加筆しています。リーナーについてリーナーは調達購買領域で、BtoB SaaSを開発提供しているスタートアップです。調達購買とはいわゆる「企業の買い物」です。複雑なプロセスが絡み合う領域ですが、現在はその中でも、見積や購買（発注）における業務を中心に扱っています。リーナー見積, リーナー購買というプロダクトを主力にしています。マネジメントは必要だが、マネージャーは必ずしも必要ではないマネジメントは組織の機能であって、役割なのに、なぜマネージャーが必要なのでしょうか。よいプロダクト、よいチームをつくるのに、みんなでマネジメントできればマ

yusuke-k 2025/10/25

リンク

Hono CLI 爆誕

これまでHonoは数々の新しいことを提供してきました。正規表現を活かしたルーター、サーバーサイドの軽量JSX、TypeScriptの型によるRPC、Web Standardを使ったマルチランタイム対応などなど。アイデアと実装力で世界と戦って来たわけです。本日私達が紹介するのは「Hono CLI」です。 Hono CLIは全く新しいコンセプトのコマンドラインインターフェースです。 create-* ではありませんただの開発用（dev&build&deploy）のコマンドではありません Viteのラッパーではありません人間とAIのためのCLIです。インストールするとのようにhonoコマンドを使うことができます。5つのサブコマンドがあります。 hono docs hono search hono request hono serve hono optimize では一つ一つを見ていきまし

yusuke-k 2025/10/24

code

リンク

はてなブックマーク

タグ

yusuke-kのブックマーク (2,284)

お知らせ

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

今週のはてなブックマーク数ランキング（2026年4月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス