凸版印刷は2月16日、画像認識AIを活用して古文書に書かれた“くずし字”の解読を支援するツール「ふみのはゼミ」を開発したと発表した。オンラインで複数人による解読作業が可能で、解読精度は90%にも上るという。価格は月額7万円(税別、以下同)から。 くずし字は江戸時代以前に使用されていた文字の一種。凸版印刷は解読済みのくずし字の形を学習させた画像認識AIを生成。画像の文字を読み取ってテキストデータに変換するOCR(光学的文字認識)技術と組み合わせた。 古文書のスキャン画像からくずし字を指定すると、AIが自動的に解読する。目視による結果を再学習させることで、文字認識の精度を上げられるという。 解読した文字や単語へのコメント機能や、解読作業の参加者が交流できるチャット機能など共同作業機能も備える。
凸版印刷、江戸期以前のくずし字を 高精度でテキストデータ化する新方式OCR技術を開発 ~江戸期以前のくずし字が80%以上の精度でOCR処理可能に~ 凸版印刷株式会社(本社:東京都千代田区、代表取締役社長:金子眞吾、以下 凸版印刷)は、江戸期以前のくずし字で記されている古典籍(内容・形態の優れた古い書物のこと)の文字を判別し、テキストデータ化するOCR(光学文字認識)技術を開発しました。凸版印刷は、本技術による古典籍のテキストデータ化サービスを2015年夏より試験的に開始予定です。 本技術は、江戸期以前の書物に使われているくずし字を自動で判読し、テキストデータ化することを可能にするものです。凸版印刷は、2013年からさまざまな書籍を高い精度でテキストデータ化する「高精度全文テキスト化サービス」を提供しています。このサービスで確立したテキストデータ化技術のシステム基盤をベースに、公立学校法人公
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く