記事へのコメント32

    • 注目コメント
    • 新着コメント
    ya--mada
    Githubサイトにある通り、NVIDIA Driverが、Linuxの場合: 450.36.06以上、Windowsの場合:520.06以上である必要があります。Macでは動かないです。私はWindowsをつかってますので、以下はWindowsだけの情報になります。

    その他
    tmatsuu
    GitHubに公開されてるのすばらしい。

    その他
    misshiki
    “国立国会図書館が公開しているOCRライブラリ、NDLOCR...このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ”

    その他
    NLPer
    どの程度のOCR精度なのかが書いていないけど、自分が試した時には求める品質には及んでいなかった。Macでは…の件はコンテナを使えばいいだけ。

    その他
    raitu
    “NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます”

    その他
    ka-ka_xyz
    ScanSnapのデフォルトOCRであんま不自由してない(pdftotextでOCR透明テキストを抜いてローカルのelasticsearchに突っ込んで全文検索してる)けど、どうなのかなこれ。

    その他
    yarumato
    “無料OCRはGeminiは縦書きに弱い。Github公開の国立国会図書館OCRライブラリは旧字体でも高い精度で認識。NVIDIAのグラボ必要。Dockerコンテナの起動。VSCodeのDocker拡張機能を使うと、作業がかなり楽に”

    その他
    prograti
    今はどうか分からないけど一太郎PadのOCRエンジンはGoogle Cloud Visionを使っているらしい https://internet.watch.impress.co.jp/docs/news/1222537.html

    その他
    kaorun
    その点Copilotのphi3、今の所縦書きとか手書きの日本語にめっちゃ弱いのが残念なんだよなぁ。Windows Recallで板書がうまく拾って貰えないんよ

    その他
    uchiten
    uchiten そっちの「ライブラリ」か。図書館のライブラリって「力こそパワー」っぽさがあるのに完全に正しい使い方だった。

    2025/03/27 リンク

    その他
    Galaxy42
    後で試す

    その他
    softantenna
    国立国会図書館が提供するOCRライブラリ「NDLOCR」をWindows環境で使用する方法についての解説。古い書籍や旧字体に対しても高い認識精度を持っているらしい。

    その他
    kwbtsts
    廃刊になった地元紙のアーカイブを画像で持っているので試してみたい

    その他
    at_yasu
    yomitoku とは別?へー。

    その他
    ardarim
    試してみたいけどそこそこのスペックのマシンがない…。性能がいいのか分からんけど取り敢えずGUIフロントエンドがないと普及はしなさそうではある

    その他
    stabucky
    「猿飛佐助」のOCRにチャレンジしたことがあるが全くダメだった。とうとうできるようになったか。

    その他
    Imamu
    Imamu 「日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます」「国立国会図書館が公開しているOCRライブラリ、NDLOCR」一太郎PadやbunkoOCRもきになる

    2025/03/27 リンク

    その他
    tekitou-manga
    おれも「そこそこ」のマシンが欲しいなと思いました

    その他
    Anonymous2000
    日本の近代以前の文字は全く読めないのだけど、史学科の友達に教えてあげよう。

    その他
    ryudenx
    すごい、これは自分でもダブルチェックしてみる

    その他
    Rouble
    Rouble デジタルコレクションの全文検索すごいもんなあ。

    2025/03/27 リンク

    その他
    kagehiens
    お、これは税金を使う意味がある機能と開発成果公開

    その他
    filinion
    国会図書館の話なのに「ライブラリ」が図書館の意味でなく混乱したのだが、ブコメを見る限り他の人はすんなり読めたらしい。さすがはてな。

    その他
    kyukyunyorituryo
    kyukyunyorituryo bunkoOCRがオススメされてたな。 https://99nyorituryo.hatenablog.com/entry/2023/09/24/020328

    2025/03/26 リンク

    その他
    FreeCatWork
    OCR?すごい技術にゃ!ボク、字が読めないから助かるにゃ!

    その他
    jintrick
    yomitokuとの比較記事待機案件

    その他
    circled
    circled ちなみに普通の縦書き日本語のOCRだと、何故かiOSアプリの一太郎Padがちょっと意味不明に強い https://apps.apple.com/jp/app/%E4%B8%80%E5%A4%AA%E9%83%8Epad/id1490522571

    2025/03/26 リンク

    その他
    l_etranger
    l_etranger へー。国会図書館がGitHubにOCRのプログラムコードをあげているの、知らなかった。旧字体や縦書きにも強い、と。今度、和古書で試してみよう。

    2025/03/26 リンク

    その他
    roshi
    roshi これは便利そう。

    2025/03/26 リンク

    その他
    k-takahashi
    k-takahashi “国立国会図書館が公開しているOCRライブラリ、NDLOCR" "現在ver2.1がGithubに公開" "古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識”

    2025/03/26 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

    はじめに 日語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は...

    ブックマークしたユーザー

    • heatman2025/04/25 heatman
    • norisuke32025/04/24 norisuke3
    • l-_-ll2025/04/23 l-_-ll
    • yug12242025/04/17 yug1224
    • yo_waka2025/04/12 yo_waka
    • gogatsu262025/04/12 gogatsu26
    • nvr3ycbp2025/04/07 nvr3ycbp
    • lugecy2025/04/06 lugecy
    • miguchi2025/04/06 miguchi
    • T-miura2025/04/05 T-miura
    • darupants2025/04/02 darupants
    • igrep2025/04/02 igrep
    • satoshie2025/04/02 satoshie
    • toyozo32025/04/01 toyozo3
    • ya--mada2025/04/01 ya--mada
    • ranto3811242025/04/01 ranto381124
    • sskoji2025/03/31 sskoji
    • krycvf2025/03/30 krycvf
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む