タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

eventとOCRに関するfunaki_naotoのブックマーク (1)

  • 奈良女子大学生活環境学部 公開講座「近代デジタルライブラリの自動テキスト化」

    国立国会図書館では著作権の切れた明治初期~昭和中期の書籍約37万冊をWeb上で公開している。しかしながら他の電子書籍と異なり、この近代デジタルライブラリは画像として公開されているため、テキストでの検索ができない。一般に書籍の画像から文字を読みだすにはOCRが使われるが、現在利用されているOCRではフォントの規格のなかった活版印刷の近代書籍文字は読み取ることができない。講座では、近代書籍用のOCR研究がどのように始まって、どのような問題点が発覚し、それをどのように解決したかを解説する。また近代書籍用OCRの開発に利用した人工知能技術についても易しく解説する。最後に現在準備が進められている公文書現代文訳プロジェクトについても紹介し、近代デジタルライブラリ用OCRとのコラボの計画についても触れる。 ・開講日時  5月21日(土) 10時30分から12時 ・講  師  城和貴(奈良女子大学教授)

  • 1