エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
すげええええ! 江戸時代以前の「くずし字」をテキストデータにできるOCR技術を凸版印刷が開発
凸版印刷が「くずし字を判別してテキストデータ化するOCR(光学文字認識)技術」を開発しました。江戸期... 凸版印刷が「くずし字を判別してテキストデータ化するOCR(光学文字認識)技術」を開発しました。江戸期以前の本や明治期の手書きの文章は「くずし字」を使って書かれており、学習しないと読むことができません。くずし字の学習は近世以前の日本文学や日本史を学ぶ学生にとっては必要不可欠で、多くの学生が「よ、読めない……」と悲鳴を上げています。 凸版印刷の開発した技術は、書物のくずし字を自動で判読し、テキストデータ化することを可能にするもの。2014年に実施した検証実験では、くずし字で記されている書物を80%以上の精度でOCR処理することができたとのこと。OCRで判読した文字は専門家によって校正・校閲され、その結果はくずし字のデータベースにフィードバックされます。 古典籍を自動で判読する技術を開発 くずし字のテキストデータ化処理の流れ 現在、くずし字で書かれている古典籍は100万点以上と言われており、大部
2015/07/08 リンク