タグ

2022年5月10日のブックマーク (1件)

  • 篆書字体データセット

    篆書字体データセットは、印文解読に有用と思われる和漢の字書・字彙類から切り出した篆書(てんしょ)字体画像を、機械学習に利用しやすい形式で提供します。データセットをご利用の際には、ライセンス、利用ガイドライン、凡例などを必ずご確認ください。 篆書字体データベース検索 篆書字体データセットの一覧を見る(機械のための学習データ) 文字種ごとの篆書字体一覧を見る(人間のための学習データ) 2022年8月現在、最新バージョン(v2.0)のデータセットの規模は、12点の資料画像から切り取った篆書体13,213文字種(*1)の文字画像データ181,084文字です。 (*1) 文字種には、Unicodeが付与できない親字「〓」も含むため、実質的な文字種の数を計算する場合は、これを除外する必要があります(参照:凡例)。 データ概要 篆書字体データセットは、複数の組織がIIIF (International

    篆書字体データセット