エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
古典などの「くずし文字」がOCRで解読可能に
OCR(optical character recognition、光学文字認識)は、スキャンした紙の資料などをデジタルテキスト... OCR(optical character recognition、光学文字認識)は、スキャンした紙の資料などをデジタルテキスト化する際にとても重宝する技術だ。ただ、ちょっと前までは、けっこうお粗末でなかなか文字を正確に読み取れなかった。しかも厄介なのは、「変換」を「愛揉」というように視覚的に微妙に異なった誤字に変換するため、文字校正をスリ抜けやすいという難点を持っていた。 そんなOCRも最近は格段の進歩を遂げ、微妙に異なった文字も解像度の調節などでかなり正確に文字を打ち出すようになり、もう信用できる実用レベルまできているようだ。このリリースによれば、さらに厄介な古文書などの「くずし字」までもテキストデータ化できる技術が開発されたらしい。これなら句読点がなくても日本人ならほぼ解読できる。 TOPPANのリリースより。 古典文学や歴史学などの研究では古文書の解読が必須だが、やはり崩された文字