[B! japan][ocr] myrmecoleonのブックマーク

myrmecoleon id:myrmecoleon

japanとocrに関するmyrmecoleonのブックマーク (2)

貴重な資料を後世に--江戸期以前の“くずし字”を判読するOCR技術が凸版印刷から [インターネットコム]
近年、災害による資料アーカイブの必要性や専門家の減少、資料の経年劣化などを理由に、歴史的資料のデジタル化・テキストデータ化が求められている。しかし、総数100万点以上ともいわれる江戸期以前のくずし字で記されている古典籍は、専門家による判読が必要とされ、テキストデータ化が遅れていた。今回発表された技術は、江戸期以前のくずし字を自動で判読し、テキストデータ化することを可能にするもの。同社は2013年より、さまざまな書籍をデータ化する「高精度全文テキスト化サービス」を提供しており、同サービスで確立したシステム基盤に、公立はこだて未来大学の寺沢憲吾准教授が開発した「文書画像検索システム」を組み合わせることで、同技術を実現したそうだ。2014年度に実施した原理検証実験では、くずし字の書物を80％以上の精度でOCR処理することに成功した。
myrmecoleon 2015/07/03
technology

ocr

text

scan

history

document

japan
リンク
オープンソースの日本語OCR「NHocr」、1行画像を認識するベータ版をリリース
東北大学の後藤英昭准教授が、Googleのオープンソース支援プロジェクト“Google Code”で開発したオープンソースの日本語OCR「NHocr」のベータ版を公開しています。ベータ版は、1行で書かれた文字画像をブラウザ形式でサーバに送信し、認識させるというものです。日本語文字行認識 – beta http://appsv.ocrgrid.org/nhocr/index-j.html H.Goto’s home page http://www.sc.isc.tohoku.ac.jp/~hgot/index-j.html （後藤准教授のウェブサイト） nhocr OCR engine for Japanese language – Google Code http://code.google.com/p/nhocr/ September 12th, 2008付けMOONGIFTの記事 h
myrmecoleon 2008/09/13
ocr

japan

oss
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx