タグ

ブックマーク / bookscanner.hatenadiary.org (2)

  •  Googleのあまりに大胆な情報収集作戦! - bookscanner記

    Amazonの真っ只中なんだけど、ちょっとだけ、Google話ね。 Googleスキャンプロジェクトが著作権でもめてるでしょ。 そこに動きあり。 話の発端は、10月5日のこの記事ね。 Google to Subpoena Yahoo, Microsoft on Book Scanning というわけでSubpoenaって何?ってことだけど、これまた法律用語だから、あまり厳密にうけとめんで欲しいけど、「召喚」ってことね。今、Googleっていろんな人から訴えられてるでしょ。そしたら、Googleは、「じゃ、YahooMicrosoftとか、他にもスキャンしてるやつらが、どんな著作権処理してんのか、説明してもらおうよ!」って言い出した。そんで、裁判所に「Subpoena」を手続きして、YahooMicrosoftがスキャンプロジェクトの実態を裁判所に提出しなくちゃいけんくなってる。もちろん

     Googleのあまりに大胆な情報収集作戦! - bookscanner記
    msk
    msk 2006/10/20
  •  1冊1.5GB、1500万冊だと20PB - bookscanner記

    ストレージについて考える。 をスキャンしたとき、大切なことがある。「最低でも2種類のデータを作り、貯めておくこと。」 ひとつ目のデータは、マスターと呼ばれ、できるだけきれいな画像。 ふたつ目のデータは、アクセスと呼ばれ、ネットとかで見て、見苦しくない程度に圧縮した画像。 なんでこんなことするのかというと、 ①やっぱり、電子化はアーカイブ目的を持つから ②現在の画像処理技術(OCRも含む)ではできないことが将来できるかもしれないから つまり、「いつか使うかもしれないから」という理由。 マスターとして重要なことは、圧縮しないか、可逆的圧縮であること。またその規格自体が、将来も生き残っていそうなもの。 アクセスとして重要なことは、ネット公開するなら、ブラウザが対応可能なファイル形式であること。 現在の主流: マスター:TIFF(圧縮なし) アクセス:JPEGかPDF あと、解像度はいくつくらい

     1冊1.5GB、1500万冊だと20PB - bookscanner記
    msk
    msk 2006/08/16
  • 1