すべての書物のデジタル化を目指すGoogle。そこで最初に直面する問題が「一体この世界には、どのくらいの数の印刷書物が存在するのか?」だ。この大きな疑問にGoogle Booksチームが挑んできた過程をソフトウエア・エンジニアのLeonid Taycher氏がブログで公開した。 書物をどのように数えるか? Googleでは本のメタデータを扱う際に"tome"(書物、学術書)を1つの書物の基準としている。数百万コピーが存在するベストセラーも、数コピーしか存在しない学術書も1つと見なす。この定義はISBN(国際標準図書番号)に近い。ただしISBNが幅広く採用されはじめたのは70年代半ばからであり、商業的な流通で提供される書物に限られる。またISBNがCDやTシャツなど本以外の製品にも割り当てられていることがある。Library of Congress Control Number(LCCN)や