タグ

OCRとindexに関するmyrmecoleonのブックマーク (1)

  • 目次山脈登山行 (TRC データ部ログ)

    データの項目数が少ない子書誌の作成は、(大きな声では言えませんが…って言ってるようなものだけど)図書に比べてかなりラクチン。号数等の数字を入力+兄弟たちとの「似てる度」を確認=5分で終了ということも。 が、しかし。時に、1時間たってもまだ越えられないような、はるか高い山が聳え立つことがあります。しかも山脈となって幾峰も連なってることもあります。 そう、「目次情報」がある子書誌を入力する場合です。 TRCの雑誌データにおける目次情報は、(私の個人的イメージですが、)「雑誌体の目次の視覚的再現」に近いと思います。 「目次に書いてあることを、書いてある順番で、データ化する」 考え方としてはとてもシンプル。「データを見ると、目次のデザインがなんとなく想像できる」のが理想でしょうか。 これで、実際の誌面も同じようにシンプルなら、作成している私たちも万々歳なわけですが、そうはいきません。 目次はやは

    myrmecoleon
    myrmecoleon 2008/09/27
    「TRCの雑誌データにおける目次情報は、(私の個人的イメージですが、)「雑誌本体の目次の視覚的再現」に近い」OCRを使っても多少は助かるが上手くいかないという話。
  • 1