はじめに 画像やPDFのテキストをコピーしたいとき、オンラインのOCRサービスに画像を送るのはちょっと抵抗がありませんか? 特に社外秘の資料や個人情報が写っている場合。 通信ゼロ、ブラウザの中だけで完結するOCR があれば安心して使えるのに — そう思って、Chrome拡張機能を作りました。 以前からいくつかの日本語OCRを試してきて、ブラウザ内でも実用レベルで動くことがわかっていたので、それを誰でも気軽に使える形にしたかったのが動機です。 yomitokuで作る日本語OCR Webアプリ — サーバーサイドで高精度な日本語OCR Tesseract.jsでカスタムモデルのトレーニング — ブラウザOCRの可能性と限界 ブラウザだけで完結する日本語OCR+透視変換 — NDLOCRをブラウザで動かす Chrome Web Store で「オフラインOCR」と検索してもヒットします。 これま
「Anthropic(Claudeを作っている会社)、開発が速すぎる」 最近、周りのエンジニアと話していると、この話題がよく出ます。僕も同じことを思っていて、いろいろ調べているうちに、単に「AIを使っているから速い」という一言では説明できない構造があることが見えてきました。 例えば、下記になります。 2026年Q1の3ヶ月で120以上の機能をリリース(18時間に1機能) エンジニア1人あたり1日約5PR(Pull Request、コードの変更を提出する単位) 社内では毎日60〜100回のリリース Claude Coworkは約10日で構築 Claude DesignはOpus 4.7のリリース翌日に公開 普通のソフトウェア開発企業の感覚からすると、明らかに異次元です。この記事では、公開されているインタビューや内部研究、関係者の発言をもとに、「なぜこんなことが可能なのか」というのを調べた限り
Spotify 20周年。もっとも聴かれたアーティスト&曲が公開2026.04.27 21:006,394 そうこ 今や日常に溶け込んだと言っても過言ではない音外配信サービス。 世界最大手のSpotifyは2006年創業、今年は20周年の年! 20周年を祝して、Spotfiyが初めて内部データを公開。過去20年でもっとも聴かれたアーティストは? 曲は? もっともストリーミングされたアーティストは…20周年にちなんで、トップ20がSpotifyサイトで公開されています。が、ここではトップ10のみ紹介。 気になる1位は…絶対的歌姫、テイラー・スウィフト! 1:テイラー・スウィフト 2:バッド・バニー 3:ドレイク 4:ザ・ウィークエンド 5:アリアナ・グランデ 6:エド・シーラン 7:ジャスティン・ビーバー 8:ビリー・アイリッシュ 9:エミネム 10:カニエ・ウェスト もっともストリーミング
※1 同じOS間:iPhoneからiPhoneや、AndroidからAndroidなど ※2 異なるOS間:iPhoneからAndroidなど ※3 LINE MUSICで「オフライン再生に保存」した楽曲は引き継がれないなど、一部のアプリケーションでは完全に引き継がれない場合もあります。 ※4 バックアップ操作が必要です。保存期間の過ぎた写真や動画はバックアップされません。 ※5 Keepサービスは、2024年8月28日(水)14:00に終了する予定です。Keepメモのトークルームは引き続き利用できますが、永久保存されず一定期間保存されます。 ※6 2025年4月30日にLINE Payサービスが終了予定です。 ※参考:あんぜん引き継ぎガイド トーク履歴をバックアップする 全てのトーク履歴を引き継ぐには、バックアップの作業が必要です。 ※異なるOS間ではバックアップ操作をしても引き継ぎでき
DSPi transforms a Raspberry Pi Pico or other RP2040-based board into a very competent and inexpensive little digital audio processor. It acts as a USB sound card with an onboard DSP engine, allowing you to make use of essential tools like room correction, active crossovers, parametric EQ, time alignment, loudness compensation, and headphone crossfeed. It is my hope that the RP2040 and RP2350 will
🚀 TL;DR AI(LLM)に生のソースコードを読ませるのは、実は効率の悪い「情報の暴力」である。 AST(抽象構文木)から「構造」だけを抽出したマップこそが、AIのIQを極限まで引き出す。 データの流入から破綻までをグラフ理論で定義すれば、理論上、脆弱性は100%特定可能となる。 1. はじめに:AIレビューの「限界」と「嘘」 最近、GitHub CopilotやChatGPTにコードを貼り付けて「脆弱性ある?」と聞く手法が定着しました。しかし、大規模なプロジェクトになればなるほど、AIは以下のような致命的な欠陥を露呈します。 コンテキストの霧:数千行のコードを前に、AIは「どの変数がどこから来たか」を見失い、平気でハルシネーション(嘘)をつく。 トークンの浪費:コードの「書き方」というノイズに注目してしまい、肝心の「ロジックの破綻」に辿り着く前にリソースを使い果たす。 そこで私は、
各種エージェントの台頭により、サーバレスに動作しローカルファイルとして保存でき、永続化可能な組み込みデータベースのSQLiteやDuckDBへの注目を感じる昨今ですね。これらDBでの全文検索(FTS)の日本語対応ってどんなものなのだろうかと調べると、trigram での検索はできるものの、日本語語彙に特化した検索は標準できないようでした。 Linderaを使うアプローチもあるようですが、今回は Rust で実装されている軽量高速なトークナイザの Vaporetto を組み込んで動く拡張機能を作ってみました。 SQLite + Vaporetto https://github.com/hotchpotch/sqlite-vaporetto DuckDB + Vaporetto https://github.com/hotchpotch/duckdb-vaporetto Vaporetto は
There’s a category of “plain text” or “ASCII” diagramming and UI design tools: Mockdown – works immediately on the web, even on mobile Wiretext – works on the web, but desktop only Monodraw – a Mac app I believe these are used by people who prefer intentionally limited visual choices, for low-key diagramming to put in source code, and – increasingly – as an entry point to gen AI. They’re so intere
Now open a new tab and go to about:config. Accept the warning when it shows up. Search for privacy.trackingprotection.content.protection.enabled and set it to "true" by clicking on the toggle. 👇 Next, search for privacy.trackingprotection.content.protection.test_list_urls, click on the "Edit" button, and paste the following value to add the EasyList and EasyPrivacy filter lists to Firefox: https:
A modern port of Turbo Vision 2.0, the classical framework for text-based user interfaces. Now cross-platform and with Unicode support. I started this as a personal project at the very end of 2018. By May 2020 I considered it was very close to feature parity with the original, and decided to make it open. The original goals of this project were: Making Turbo Vision work on Linux by altering the le
WSL9x Windows 9x Subsystem for Linux. WSL9x runs a modern Linux kernel (6.19 at time of writing) cooperatively inside the Windows 9x kernel, enabling users to take advantage of the full suite of capabilities of both operating systems at the same time, including paging, memory protection, and pre-emptive scheduling. Run all your favourite applications side by side - no rebooting required! Proudly w
どうも!オペ部の西村祐二です! Playwright CLI v0.1.8 が 2026-04-14 にリリースされました。今回、 playwright-cli attach --cdp=chrome で普段使っているローカルの Chrome / Edge にそのまま接続できるようになった点です。これまでのようにサンドボックス化された別ブラウザを起動する必要がなく、既存のログイン状態や拡張機能を持った Chrome をそのままエージェントや CLI から操作できます。 何がリリースされたか 概要: attach --cdp=<channel> でローカル起動済みの Chrome / Edge へ接続する Remote debugging mode が追加されました。あわせて CLI 終了後に残る Chrome プロセスの解消と、MCP server registry のクリーンアップ修正も
Introducing ggsql, a grammar of graphics for SQL that lets you describe visualizations directly inside SQL queries Read more... Today, we are super excited to announce the alpha-release of ggsql . As the name suggests, ggsql is an implementation of the grammar of graphics based on SQL syntax, bringing rich, structured visualization support to SQL. It is ready for use in Quarto, Jupyter notebooks,
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? VimからEmacsに移った経緯 もともとはVimを1年ほど使っていました。 自分がVimを触っていた当時は、Python、Node.js、Deno、Rubyなど、さまざまな言語でプラグインが作られていました。 当時の自分の会社では、そのあたりが規約や運用方針と少し相性が悪く、より一本化しやすい環境を求めてSpacemacs経由でEmacsに移行しました。今はSpacemacsも離れて、普通のバニラEmacsをEmacsキーバインドで使っています。 そんな流れで、ここ数年はずっとEmacsを使ってきました。 その後、改めてNeovimを
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く