タグ

OCRと本に関するbull2のブックマーク (1)

  • グーグルの変な機能を見つけた。 - out to lunch!

    グーグルブック画面で、「inpublisher:"出版社名"」と入力して検索してみる。出版社名のところには、実際の出版社、岩波書店でも白水社でもなんでも良い。例えば岩波書店だったら、検索窓で「inpublisher:"岩波書店"」と入力し、検索する。 すると「inpublisher:"岩波書店" の検索結果 12482 件中 1 - 10 件目」の文章とともに、一覧で10点の書籍が表示される。タイトルによっては左に画像が貼り付けられているが、それは表紙ではなく、目次であったり奥付であったりする不思議な画像である。 さらに特定のタイトルをクリックしてみよう。タイトルの詳細頁に飛ぶが、「バージニア大学 の蔵書」や書かれているところから察するに、これは、グーグル図書館プロジェクトによってスキャニングされた書籍である、ということを、ここでようやく理解する。「バージニア大学の蔵書」は、別なタイト

    bull2
    bull2 2007/12/27
    クオリティが低いからわざと無視してるという可能性は無いのかな。「問題は、あまりにもOCR変換の性能が悪いこと」「出版社が関与しないとコンテンツのクオリティが著しく劣化する典型的な事例」
  • 1