ysogのブックマーク - はてなブックマーク

「DeepSeek-OCR2」を試す

なぜか公式からアナウンスが出ていない。以下はUnslothのポスト。 DeepSeekがDeepSeek-OCR 2をリリースしました。🐋 新しい3Bモデルは、SOTAの視覚、ドキュメント、OCR理解を達成します。 DeepEncoder V2が導入され、これによりモデルは人間と同じ論理的な順序で画像をスキャンできるようになり、OCRの精度が向上します。従来のビジョンLLMが画像を固定グリッド（左上→右下）で読み取るのに対し、DeepEncoder V2はまず全体的な理解を構築し、次に人間のような読み取り順序を学習します - 最初に何に注目するか、次に何を、といった具合です。これにより、複雑なレイアウトでのOCRが改善され、列を追う、ラベルを値にリンクさせる、テーブルを一貫して読む、テキストと構造の混合をより確実に扱うことが可能になります。 DeepSeek-OCR 2はベンチマーク

ysog 2026/04/30

リンク

日本語の手書きメモを書き起こせるOCRを探すために23モデルを片っ端から試した話

こんにちは！逆瀬川ちゃん (@gyakuse) です！今日は日本語の手書きメモをいい感じに書き起こしてくれるOCRを探して、23モデルを片っ端から比較してみた話をまとめていきたいと思います。手書きメモは楽しいが電子化がつらいわたしはいまだに手書きメモをよく書きます。打ち合わせの最中にさっと書いたり、アイデアを整理するときにペンで図を描いたり。手を動かしながら考えるのはとても楽しいし、タイピングとは違う思考の広がり方があります。ただ問題は電子化です。ノートに書いたメモをあとからSlackやNotionに転記するのがとにかくつらい。自分の字を自分で読み返す作業がすでにつらいのに、それを打ち直すのは二重苦です。 OCRで自動化したいのですが、日本語の手書き文字って既存のOCRモデルにとってはかなり難しいタスクです。活字ならどのモデルでも高精度ですが、手書きとなると精度がガクッと落ちます。

ysog 2026/04/30

リンク

なぜAI-OCRソフトウェアYomiTokuはNCライセンス(商用利用不可)で提供しているのか｜Kotaro.Kinoshita

YomiToku を公開してから約 1 年が経過しました。ここであらためて、なぜ YomiToku を公開したのかなぜ NC ライセンスという形を採用したのか何が解決できているのかを整理して note にまとめます。背景YomiToku は、日本語に特化した AI-OCR・レイアウト解析を行う文書解析エンジンです。2024 年 11 月末の公開以降、GitHub のスター数は 1,000 を超え、多くの反響をいただいています。現在、YomiToku は無料で公開していますが、完全な OSS ではなく、NC（Non-Commercial）ライセンスで提供しています。NC ライセンスは「非商用」という大枠はあるものの、世界的に見ても厳密な定義が存在しない曖昧なライセンス体系です。そのため、利用者が迷わないように、私は以下のような線引きで運用しています。実際にお問い合わせをいただ

ysog 2026/04/30

リンク

AZUCO World ver6.0

ysog 2026/04/28

リンク

CRUD Style UI - kawasima

業務システムの画面を、テーブルのカラムをそのまま入出力フォームに並べる形で作る設計。一覧・検索・登録・編集・削除を1セットの画面群として揃え、ユーザの業務フローではなく、データ構造のCRUDをそのまま画面化したもの。日本のSIer現場では「画面駆動設計」とも呼ばれるが、根は同じで、テーブル定義が先にあって画面はその入出力フォームになる。ユーザが何をしに来たか(申請を出す、状況を確認する、上長承認を待つ、月次で締める)という行動軸ではなく、「商品マスタ画面」「受注一覧画面」「承認待ち一覧画面」のようにテーブル軸で画面が並ぶ。例えば受注管理画面の典型はこうなる。画面上半分に受注番号・各種日付・ステータス・倉庫・商品コード・商品分類など30以上の検索条件が並び、下半分の一覧では1レコードが多段に折り返されて表示される。検索条件・一覧表示・詳細編集がテーブル全カラムを軸に組まれており、「今日出

ysog 2026/04/28

リンク

LLMに渡す前に関連しない文を削除するモデル OpenProvence を公開 - A Day in the Life

昨今、LLMが回答するための「良い知識」を作るために、検索を行い情報を集め、さらに足りない知識を補うために多方面のさまざまな検索クエリを作り検索結果から必要な情報だけを抽出したり…といったことを、再起的に行っています。AI Agent、DeepResearch、Context Engineering と 2025年の流行の技術では、このような検索を裏側で行うことがしばしばあり、筋が良い情報をいかに検索で取得できるかが鍵になることも多いでしょう。しかしながら、大量に検索を行うと「検索結果」の情報も同時に増加していきます。そのため、本当に必要な情報の抽出をLLMが間違えたり、ハルシネーションが起きたり、入力情報の増加により処理が遅くなったり、LLM利用費用が増加したりと、大量の検索が難しかったりもします。そこで、検索結果をLLMに渡す前に、関連しない情報は削除しちゃおう、ついでに関連度スコ

ysog 2026/04/27

リンク

なぜ、2000年代には巷で耳にした「UML」を現在では全く耳にしないのか？

はじめに 2000年代の開発現場では、UML という語は一種の共通語でした。オブジェクト指向を語るならUMLを知っていて当然だとされ、書籍も研修もツールも、その前提で組まれていました。しかし現在、日常会話の中で「UMLを描こう」と言う場面は激減し、代わりにMermaid(軽量な図記述ツール)やPlantUML(テキスト記述からUML図を生成するツール)で必要な図だけを書くという言い方が普通になっています。この落差は、単なる流行語の交代ではありません。設計の正本をどこに置くのかという、開発の重心そのものが移った結果です。本稿はラショナル起源の重いUML と、ファウラーが後から整理した軽いUML と、2010年代以降の高速な開発環境が、どのようにぶつかったのかということを語ります。結論を先取りすれば、消えたのは図そのものではなく、UMLという名称に付着していた制度と商売でした。そして残

ysog 2026/04/24

リンク

https://openai.com/index/introducing-gpt-5-5/

ysog 2026/04/24

リンク

日本、メキシコから原油100万バレル調達へ　首脳合意で7月に到着 - 日本経済新聞

日本政府がメキシコから原油を100万バレル輸入すると合意したことが22日、わかった。7月にも日本に到着する。米イラン衝突で原油輸入の中東依存のリスクが顕在化するなか、中南米に調達先を広げる一歩となる。高市早苗首相がメキシコのシェインバウム大統領と21日に電話協議し、原油の輸出拡大を要請していた。日本は原油の9割以上を中東からの輸入に頼る。ホルムズ海峡の事実上の封鎖で供給懸念が生じており、政府が

ysog 2026/04/23

リンク

韓国大統領秘書室長「４カ国から原油２億７千万バレル…ナフサも最大２１０万トン」（ハンギョレ新聞） - Yahoo!ニュース

カン・フンシク大統領秘書室長が15日、大統領府春秋館のブリーフィングルームで、戦略経済協力大統領特使の活動結果についてブリーフィングをおこなっている=大統領府写真記者団カン・フンシク大統領秘書室長は15日、サウジアラビアなど4カ国から「今年末までに原油2億7300万バレルを導入することを確定した」と発表した。これは3カ月以上使用できる量で、ホルムズ海峡ではなく「代替供給ルート」を通じて導入される予定だ。カン室長はこの日の大統領府でのブリーフィングで、「中央アジアの資源大国カザフスタン、中東地域のエネルギー供給国であるオマーン、サウジアラビア、カタールの4カ国を訪問し、原油とナフサの確保策を協議した」として、「ナフサも年末までにさらに最大210万トンを確保した」と語った。カン室長は李在明（イ・ジェミョン）大統領の戦略経済協力特使として、今月7日から中央アジアと中東地域を訪問し、14日に帰

ysog 2026/04/23

リンク

iDeCo50歳以上に追加拠出枠　自民党案、氷河期世代の資産形成を支援 - 日本経済新聞

自民党の資産運用立国議員連盟が近くまとめる提言案が判明した。個人型確定拠出年金（iDeCo、イデコ）などで50歳以上を対象に追加拠出枠を設ける。就職氷河期世代の資産形成を支援するため次の年金制度改革までの検討を政府に求める。同議連が23日に開く総会で提言案を議論する。具体的な限度額や枠組みは諸外国の事例などを参考にして詰める。イデコの加入者数は2月時点で390万人ほどにのぼる。厚生労働省によ

ysog 2026/04/22

リンク

【Claude×デジタル庁】いつものデザインテンプレをスキル化しよう｜しらき＠パワポ図解

よく「ダサいパワポを簡単にお洒落にする」方法を聞かれるのですが、いまのところ一番よく使っているのが、デジタル庁が公開している「ダッシュボードデザイン実践ガイドブック」をClaudeに読み込ませる方法です。鮮やかなロイヤルブルー、余白をたっぷり取ったミニマルなレイアウト、大きくて潔い見出し。派手さはないのに信頼感があって、読む気にさせるビジネスデザインの王道です。そこで今回はClaudeを使って、ワンクリックでパワポをデジタル庁風デザインに変換する方法と、その手順をスキルとして保存する方法をお伝えします。１．ワンクリックでパワポをリデザインワンクリックでパワポをデジタル庁風デザインに変換する方法は、手元のパワポとデジタル庁のデザインテンプレPDFを、Claudeのチャットに貼って、こう頼むだけです。 PDFのデザインテンプレを利用して、添付のパワポのデザインを修正して Claude C

ysog 2026/04/20

リンク

サプライチェーンアタック対策とdependabot活用 | おそらくはそれさえも平凡な日々

注: 本記事は執筆時点(2026年4月)の情報をもとに書いています。実際のご利用にあたっては、公式ドキュメント等の最新情報を参照し、正確性を確認の上ご利用ください。さて、axiosへの攻撃の件で、サプライチェーンアタックの恐ろしさを改めて感じさせられました。外部ライブラリを使う場合、基本的にはセキュリティ面も含めて最新バージョンを使いたいわけですが、その更新作業は脆弱性が入り込みやすいタイミングでもあるというジレンマがあるわけです。なので、以下のようなポリシーとフローでの外部ライブラリ利用が現状の推奨要件と言えるでしょう。基本は最新バージョンを使う機能面、パフォーマンス、セキュリティ面でより良い追随を怠ると更新が困難になり、新機能が使えないだけではなく、セキュリティリスクも高まるただし、新バージョンリリース直後ではなく、しばらくしてから最新版を適用する最新バージョンに問題が無

ysog 2026/04/20

リンク

濃縮ウランを「核の塵」と呼び続けるトランプ氏、何のことを言っているのか？　専門家から疑念

会合で身振り手振りを交えて話をするトランプ氏＝16日、ネバダ州ラスベガス/Jim Watson/AFP/Getty Images （CNN）トランプ米大統領は16日、イランが核兵器を保有しないことと「核の塵（ちり）」を引き渡すことに同意したと主張した。「核の塵」というのは、イランの高濃縮ウランの備蓄を指してトランプ氏が使っている言葉だ。「核の塵」は原子力産業で一般的な用語ではない。専門家の間では、濃縮ウランに関するトランプ氏やウィトコフ中東担当特使の発言を巡り、技術的な内容をどの程度理解しているのか疑念を抱かせるものだとの指摘が出ている。ウィトコフ氏はもともと不動産開発業者で、トランプ氏の娘婿ジャレッド・クシュナー氏と共に対イラン交渉を主導してきた。そのウィトコフ氏もイランとの今年2月の核協議以降、同様に知識不足を露呈する主張を行ってきたと、専門家は指摘する。兵器やエネルギー生産に

ysog 2026/04/19

リンク

Obsidian: ベクトル検索でタグやディレクトリをつかわないデータ管理｜Aki

TL;DRObsidian のタグ付けやフォルダ分けといった「整理のための整理」が面倒ベクトル検索で検索できるようにする claude code や codex のような AI ツールと連携背景Obsidian のタグ付けやフォルダ構造の設計に悩む人は多いのかなと思います。Web で検索すれば、凝ったタグ戦略やディレクトリ管理術がたくさん見つかります。しかし、正直なところ、そのルールを維持し続けるのは結構な手間です。ノートを取るたびに「どのタグを付けようか」「どのフォルダに入れようか」と考えるのは面倒です。方法と結果markdown をベクトル検索する仕組みにしました。中心となるのは vector.sh というシェルスクリプトです。レポジトリ script/vector.sh search "キーワード"例えば、search "認知症" と実行すると、以下のように関連性の高い順にノー

ysog 2026/04/17

Obsidian

リンク

Obsidian × Claude Code：メモを書くだけでAIに文脈が伝わる構成を作った | DevelopersIO

はじめにこんにちは！クラスメソッドオペレーションズカスタマーサクセス部 SREの山田です。プロジェクトでは、日々のメモ・調査記録・Claude Codeとのやり取りが混在しがちです。また、部内のMTGや1on1など社内のあれこれがあれば尚更です。「メモはObsidianに書いているけど、Claude Codeにうまく文脈を渡せない」という悩みを解決するために、プロジェクトごとにObsidian vaultとClaude Codeの作業ディレクトリを一致させる構成を作りました。ディレクトリ構成 ~/Develop/Claude/ └── projects/ ├── project_a/ ← Obsidian vault（プロジェクトA） │ ├── .obsidian/ ← Obsidianの設定ファイル群 │ │ ├── app.json │ │ ├── core-plugi

ysog 2026/04/16

リンク

macOS 版 Gemini - あなた専用の AI を備えたネイティブデスクトップアプリ

パソコンのどの画面からでも Gemini にアクセス可能。トピックの明確化や数式の呼び出しに利用でき、タブを開かずに作業画面上でブレインストーミングも行えます。必要に応じたサポートが得られます。

ysog 2026/04/16

リンク

Yahoo!ニュースエキスパートオーサー勝川俊雄さんのコメント - Yahoo!ニュース

見解「ぐうの音もでない」というよりは、開いた口が塞がらない記事でした。筆者は、漁獲量減少は、資源ではなく漁業者の減少が原因と主張しています。データに基づいて、資源が減っていないことを示すべきです。実際には、国の研究所の資源評価では、低水準の資源がおおくなっています。漁業者のアンケートでも約9割の漁業者が資源は減っていると答えています。また、漁獲枠が大幅に余っているのは、業界に配慮して、頑張っても獲りきれないような過剰な漁獲を設定しているからです。筆者の経歴からすると、これらの事情を知らないはずがないので、都合が悪いから、触れていないのでしょう。漁獲規制に関して、責任を追う立場の人間が、自らの失策を印象操作でごまかそうとしているように見えます。 10年前までは、水産庁もこの記事のようなスタンスだったのですが、現在は、資源の減少を認めて、国として規制を強化する方向で努力をしています。