凸版印刷が、江戸以前のくずし字を高精度にOCRする技術を開発したそうです。この技術は、2013年から提供している「高精度全文テキスト化サービス」をベースに、公立学校法人公立はこだて未来大学が開発した「文書画像で検索システム」と組み合わせ、くずし字で記されている古典籍のOCRが可能になったそうです。 ascii.jp 古典籍は、博物館などでも見る機会がありますが、驚くほど読めないですよね…(笑)興味を持つきっかけとして非常にハードルが高いな、と思っていたので、こうしてOCRでテキストデータになるのは非常に意味があるな、と思いました。 日経コンピュータでも2015年9月8日付の記事で紹介されていました。 itpro.nikkeibp.co.jp 凸版印刷のリリース の方でも、説明をされているのですが、とてもいいな、と思ったのは、日本文学研究者・東京大学大学院教授 ロバート キャンベル氏のコメン