LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了この度開発したOCRモデルは国立国会図書館の文字認識性能評価において、96%の項目で目標値を上回る結果に LINE株式会社 AIカンパニー(本社:東京都新宿区、カンパニーCEO:砂金 信一郎)は、国立国会図書館(東京都千代田区)が保有するデジタル化資料247万点、2億2300万画像を対象とした「デジタル化資料のOCRテキスト化」作業を受託し、同プロジェクトにおいて、「CLOVA OCR」の技術によるモデル開発を実施、全文のテキストデータ化が完了しましたことを、お知らせいたします。 「CLOVA OCR」は、書類・画像に記載された文字等の情報をテキストデータへ変換するサービスです。 OCRモデルの研究・開発経験豊富なチームが、日々ユーザーニーズに寄り添いながら製品改善を
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く