タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

特許と技術に関するwand125のブックマーク (1)

  • Googleはこうして膨大な数の本をスキャンしているようだ | 栗原潔のIT弁理士日記

    言うまでもなくGoogle Books Library Projectでは、図書館の膨大な蔵書をスキャンしてOCR処理をしてテキスト化するという作業が必要になります。ここではOCRの認識率などの問題もありますが、何と言っても最大の課題は物理的なスキャン作業でしょう。 一般にをフラットベッド・スキャナーやコピー機でスキャンするのは相当面倒くさいですし、特にが厚い場合にはうまく読み取れないこともありますね。最後の手段としてをばらすという方法もありますが、そもそもGoogle Books Library Projectでは図書館の貴重な蔵書を扱っている以上、それも非現実的と思われます。 で、Techmeme経由のブログ経由で知りましたが、Googleは書籍のスキャン手法に関して米国で特許を取得しています(米国特許7508978)。 の上方から2つのカメラでページを撮影し、ページの凹凸の画

    Googleはこうして膨大な数の本をスキャンしているようだ | 栗原潔のIT弁理士日記
  • 1