タグ

GoogleとBookに関するwand125のブックマーク (2)

  • http://arekore.nobody.jp/bestbooks.html

    はじめに 巨大な対象の全貌を見通すには、対象から距離を取らなければならない。21世紀になってからの7年という期間は、20世紀という巨大な対象の全貌が姿を現すのに十分な時間であったかどうかは分からないが、20世紀にはどのような著作が出版されたのかを纏めてみようと私が思い立ったのは、著作の被引用数、すなわち任意の著作が他の著作にどれだけ引用されているかが、Google Scholarを用いて調べられることが分かったからである。この小論の目的は、被引用数という指標を用いて、20世紀の文系学術書のランキングを作ることである。以下には、「文系学術書」という限定が必要であった理由を記そう。 ある著作の被引用数という指標は、その著作が学術の世界でどれだけ影響力があったかを客観的に知る手がかりになる。被引用数という指標は、引用し、引用される著作のネットワークの中で、任意の著作がどのようなポジションにいる

  • Googleはこうして膨大な数の本をスキャンしているようだ | 栗原潔のIT弁理士日記

    言うまでもなくGoogle Books Library Projectでは、図書館の膨大な蔵書をスキャンしてOCR処理をしてテキスト化するという作業が必要になります。ここではOCRの認識率などの問題もありますが、何と言っても最大の課題は物理的なスキャン作業でしょう。 一般にをフラットベッド・スキャナーやコピー機でスキャンするのは相当面倒くさいですし、特にが厚い場合にはうまく読み取れないこともありますね。最後の手段としてをばらすという方法もありますが、そもそもGoogle Books Library Projectでは図書館の貴重な蔵書を扱っている以上、それも非現実的と思われます。 で、Techmeme経由のブログ経由で知りましたが、Googleは書籍のスキャン手法に関して米国で特許を取得しています(米国特許7508978)。 の上方から2つのカメラでページを撮影し、ページの凹凸の画

    Googleはこうして膨大な数の本をスキャンしているようだ | 栗原潔のIT弁理士日記
  • 1