タグ

2015年10月23日のブックマーク (1件)

  • 正解コード付き文字・数学記号画像データベース InftyCDB

    InftyProject ではさらに多くの研究機関に置いて、科学文書用のOCRソフトウェアーの研究が行われることを願い、プロジェクトでもっているデータベースで、広く研究に役立つと思われるものを整理し、公開していくことにしました。 著作権の問題に配慮し、また拙速に陥ることがないよう、十分に吟味したものだけを公開しますので、信頼性の高いデータベースになっていると期待していますが、使用してみて問題点などに気がついた方はご連絡頂ければ幸いです。 1.InftyCDB-1 (数学文書の文字・記号・単語・数式データベース第1回配布版、2005年3月18日公開) 説明: InftyCDB-1 には、30の英文数学論文、全476ページから採集した、688,580個の文字・記号の画像と正解文字コードが収納されている。 文字・記号は単語単位、数式単位で収納され、数式には数式構造を示すリンク構造も収納されていま