国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/yanosen_jp

543users がブックマークコメント

コメント

31

記事へのコメント31件

注目コメント
新着コメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

はじめに日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は... はじめに日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます。最近ではGeminiなどにOCRさせることも試みてますが、縦書きに弱いのが欠点。加えて、私がやっているような著作権が切れた戦前の本のデジタル化の場合、認識率の低い旧字体が多いのが悩みの種。そこで最近知ったのが、国立国会図書館が公開しているOCRライブラリ、NDLOCRです。国会図書館のデジタル資料（国立国会図書館デジタルコレクション)から全文テキストデータを作成するために開発されたとのこと。 NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます。今回は、このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ

ブックマークしたユーザー

techtech05212025/08/03
heatman2025/04/25
norisuke32025/04/24
l-_-ll2025/04/23
yug12242025/04/17
yo_waka2025/04/12
gogatsu262025/04/12
nvr3ycbp2025/04/07
lugecy2025/04/06
miguchi2025/04/06
T-miura2025/04/05
darupants2025/04/02
igrep2025/04/02
satoshie2025/04/02
toyozo32025/04/01
ya--mada2025/04/01
ranto3811242025/04/01
sskoji2025/03/31

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx