タグ

ブックマーク / bookscanner.hatenadiary.org (31)

  • Google Book Searchと著作権 - bookscanner記

    GBS関連のまとめ記事が、最近増えてきた。かなりあやしいー。何かたくらんでる。 というわけで、今日は、一番最近のまとめ記事をご紹介。 『Google Book Search Libraries and Their Digital Copies』 by Jill E. Grogg, Electronic Resources Librarian, The University of Alabama Libraries and Beth Ashmore, Cataloging Librarian, Samford University http://www.infotoday.com/searcher/apr07/Grogg_Ashmore.shtml まず、GBSに参加してる図書館ってどこだっけ?最初は5つだけだったから、全部覚えてたけど、どんどん増えて、今じゃ、一体いくつあんのかさえ、分から

    Google Book Searchと著作権 - bookscanner記
  • ネットで「本」を読む? - bookscanner記

    むかーしに、「ネットで「」を読みますか?」ってなことで、いろんな人が、いろんなこと言ってた。 http://slashdot.jp/askslashdot/article.pl?sid=04/09/25/083204 とりあえず、これは「ネット読書」に関する古典だと思ってるよ。必読。 あれから、ずんどこ時代はかわり、みんなは今、果たして「ネットで「」を読む」んかな? まぁ、さっきのSlashdot記事をぜーんぶ読めば、たいていの、賛成・反対意見はモーラされてんので、とりあえず一安心。 ところが、こーんなところで安心して、油売ってる場合じゃない。時代はかわった(らしい)。 何が変わったかって言うと、今ネットでを読まん理由があるとすっと、それはもはや、「モニタが見づれー」とか「電池がどーのこーの」なんて問題じゃなくなってる(面がある)。 そんなわけで、「ネットで」に関する「2007年の

    ネットで「本」を読む? - bookscanner記
  • Amazonで「本が本を読む」様子でもみましょ - bookscanner記

    前に、の電子化の「あっち側」ってことで、電子化した画像(+OCRデータ)使って、何やりたいのか、ってのを少し考えた。 http://d.hatena.ne.jp/bookscanner/20060814 一方、「こっち側」の話は、要はインターフェースの問題だよね。見やすいよーに、ってこと。でも、何度か言ってるけど、こんなのおもろくもなんともない。所詮、「みにくい」んだよね。どーんなにがんばったって。 だから、やっぱおもろいのは、「あっち側」。 そんで「あっち側」で、アメリカ(あたり)の優秀(かもしんない)頭脳がたーくさん集まって、血眼になって、何をゴソゴソやってんのか、っちゅうと、 「あるに違うを読ませて、自分の中の文章がどこに出てくんのか、自分の中の文章がどっから来たのかってのを探してる」わけ。そんなことして、何になんのか、ってのは、また近い将来詳しく見ていきたいけど、とりあえず、

    Amazonで「本が本を読む」様子でもみましょ - bookscanner記
  • JPEG 2000はどーよ? - bookscanner記

    (アップする順番がめっちゃくちゃになってきたので、書くぞ!と宣言したもんが、いつ出現するのか、分からん状態になってる。あしからず。) 今日は、画像のフォーマットの話をしましょ。 前にhttp://d.hatena.ne.jp/bookscanner/20060815/で書いたんだけど、 をスキャンしたとき、大切なことがある。「最低でも2種類のデータを作り、貯めておくこと。」 ひとつ目のデータは、マスターと呼ばれ、できるだけきれいな画像。 ふたつ目のデータは、アクセスと呼ばれ、ネットとかで見て、見苦しくない程度に圧縮した画像。 ってなわけ。 そんで、 現在の主流: マスター:TIFF(圧縮なし) アクセス:JPEGかPDF なんだけど、JPEG 2000はどーなのよ、ってことが、長い間、業界内でくすぶってるわけ。(念のため注:JPEGとJPEG 2000は名前が似てるけど、違うもん。) そ

    JPEG 2000はどーよ? - bookscanner記
  • どーやってページをめくりましょ? - bookscanner記

    今日は、ユーザーインターフェースについて、考えましょ。(人間が読むために電子化してんじゃないんだけど、それでも、どーせなら読んでみたいよ、ってのが世の常。そんで、読む以上、読みやすいよーにせんとあかんわけ。だから、なにげに、インターフェースは重要だよん。) http://www.flib.jp/ってのがあるでしょ。これって、雑誌とかがタダで見れるので、得した気分。でも、ひとつだけ、疑問。ページのめくる音ってホントーに必要かな?その前につけなきゃいかん機能があるんではないかな。 まぁ、何はともあれ、このflibってのは、カレントを、便利に見せましょ、ってインターフェースね。開発途上のシステムということで、多少の問題を大目に見たとしても、デキが悪い(よーな気がする)。関係者の方、怒らないでね。 私のオススメを紹介しましょ。こっちはアーカイブの閲覧用インターフェースね。 http://archi

    どーやってページをめくりましょ? - bookscanner記
  • 証人喚問後半 - bookscanner記

    (前回からの続きね。) bookscanner検察官: 「ところで、この資料によると、Questia社はあのケネス・レイさんと関係があんだよね?」 弁護士: 「異議あり!件とは関係ないでしょ。」 bookscanner検察官: 「関係ないんだけど、ちょっと聞いてみたかっただけ。なので質問は以上。」 裁判長: 「次に、弁護士さん、どうぞ。」 弁護士: 「Williamsさん、ずばり聞くけど、あんたんとこは、なんで失敗しちゃったの?」 Williamsさん: 「バブル崩壊が、想定外だったよ。*1」 通訳: 「・・・」 弁護士: 「もっと具体的に言って。」 Williamsさん: 「2001年半ばの段階で、うちらは、1億ドルの大金と、30ヶ月という時間を投資してたんだよ。そんなことできる会社なんて、他にはありゃせんよ。つまり、独壇場だったんよ。*2」 通訳: 「・・・」 弁護士: 「Willi

    証人喚問後半 - bookscanner記
  • カレントとアーカイブ - bookscanner記

    の電子化」ってのは、ある意味ブームだから、みんな、なんとなく分かってる。でも、「なんとなく」だから、いろんなことがごっちゃまぜになってて、ときたま、混乱してるよーに見える人がいるよ。 今回から数回にわたって、「電子化」にまつわる分類を、いくつか紹介すんね。いつものごとく、厳密さよりも、分かりやすさを優先してんので、大きな心で受け止めてね。そんで、少しでも混乱が晴れてくれればいいんだけど、もし余計混乱しちゃったら、カンベンね。 今日は、タイトルどおり、カレントとアーカイブ。 「の電子化」と言っても、二つあって、カレントとアーカイブ。言い換えると、「電子形態での出版」と「既存の電子コピー作成」かな。 ってのが、最近の口癖。口にタコができた。 この資料の図を見ると、わかりやすいよーな気がするよ。(じゃなくて、学術雑誌についてだけどね。) かなり、おおざっぱに言えば、これから出すもんは、

    カレントとアーカイブ - bookscanner記
  •  残すもんと残さんもん - bookscanner記

    引き続き、「捨てる」を考え中。そんで、「捨てる」前に電子化して残しとかんと、後悔するかもしんない、って話をした。でも、こういう話をすると、スキャン画像はカラーか白黒か、解像度はいくつか、なんていう話にされちゃう。もちろん、そういうことも重要なんだけど、それ以前に、について何を残すべきなの?って部分が抜けてると思うんだよね。(どのを残すか、じゃないよ。のどの部分を残すか、だよ。)今日はその話。 例えばね、前にも紹介した「大学図書館について、あれこれ語る会*1」の第4回目で、「文献資料の収集・保存に関する課題と今後について、・・・東京大学東洋学研究情報センター田中教授より発表・・・が行われた」わけ。(http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu4/gijiroku/002-1/05062001.htm)そん中で、田中さんは、 歴史

     残すもんと残さんもん - bookscanner記
  •  「自動車」における「自動」の意味 - bookscanner記

    過去2回、フランスのInfotechnique社の様子を伝えたよ。今日は、Internet Archive社のスキャン現場を見てみましょ。タイトルを「はこうしてスキャられる(3)」とすべきだったかもしんないけど、思うところあって、変えてみたよ。 もし10分くらい時間があるなら、このビデオを見てね。今から2年前のビデオね。この分野における技術進歩のスピードを考えると、このビデオに写ってる2004年の状況ってのは、大昔のこと。でも、基的な部分は変わらない(はず)。 http://www.archive.org/stream/scanning_robot/scanning_robot_256kb.mp4 時間 だいたいの内容 00:00 - 06:40 Jonathanさんが、作業してる風景 06:40 - 08:30 スキャナが置いてあるトロント大学の風景 08:30 - 再びJonath

     「自動車」における「自動」の意味 - bookscanner記
  •  Amazonスキャンはなぜ安い?(1) - bookscanner記

    ここ2年くらい、よく質問されることがある。 中国とかでスキャンすると、当に1冊1ドルくらいでできるんの? って質問。これって、かなり返答に困るんだよね。何でかって言うと、 質問した人は、「YesかNo」って返答を期待してんだけど、どう考えても、そんな単純な話じゃない。でも、しょうがないから、「だいたい10万冊くらいをスキャンする覚悟があって、しかもそのが返ってこなくてもいいんだったら、可能かもしんないよ」って言って、お茶を濁す。でも、たいてい質問した人は、その返答に満足そうなので、そこで終わる。 この記には、お茶を濁さず書いとくね。3回シリーズ(くらい)。 まず今日は、ちょいと寄り道から。「1冊1ドルだなんて、誰が言いだしたんだ?」 言いだしっぺは、ズバりGary Wolfさん。2003年10月くらいに、Wolfさんの『The Great Library of Amazonia』という

     Amazonスキャンはなぜ安い?(1) - bookscanner記
  •  Amazonスキャンはなぜ安い?(2) - bookscanner記

    前回は、巷の「1冊1ドル」説はかなりいい加減!って話をした。でも、今回は翻って、(できるだけ具体的に見ていくことで、)「Amazonは、当に1冊1ドルくらいでスキャンしてるかもしんない」ってことを書く。(でも、かなりいろんな条件がつくけどね。) 大前提 Amazonは、スキャン対象を、タダでもらえる (この前提が崩れると、全く話にならん) スキャンしたは、そのままポイ捨てするけど、環境団体からは訴えられない (10万冊だと約25トンのゴミになる)*1 クオリティは、「なか見!」で使える程度でよい (スキャンレベルとして、10段階の2くらいかな) OCR処理などは、料金にふくまれない 順番に見ていこう。 まず、アメリカからインドへを送るといくらくらいかかんの?こういうときは、実際に送ったことのある人に聞けばよい。(http://www.library.cmu.edu/Librarie

     Amazonスキャンはなぜ安い?(2) - bookscanner記
  • bookscanner記 -  Amazonスキャンはなぜ安い?(3)

    過去2回にわたって、Amazonの「1冊1ドル」伝説を検証してたんだけど、最後に、Amazonプロジェクトを、他のプロジェクトと比較してみるよ。そんで、なんでAmazonだけが「1冊1ドル」に挑戦できるのか、ってところね。 日の命題: スキャン料金は、残したい思い出の量に比例する Amazonプロジェクトと、他のプロジェクト、例えばGoogleプロジェクトを比較すると、最大の違いは、スキャンしたあとのの処理にあるんじゃないかな。 Aプロジェクト: スキャン終わったら、ポイ捨て Gプロジェクト: スキャン終わったら、ちゃんと耳をそろえて、ご返却 この違いがでる理由は、Aは出版社から提供される最近のをスキャンしてんだけど、Gは図書館にある古〜い(思い出びっしり)をスキャンしてるからなんだけど、この違いは結構大きなコスト差となっちゃう。なんでかっていうと、Gプロジェクトに比べて、Aプロジ

    bookscanner記 -  Amazonスキャンはなぜ安い?(3)
    Masayuki
    Masayuki 2006/11/11
    AmazonとGoogleのデジタル化プロジェクトを比較。「スキャン料金は、残したい思い出の量に比例する」(→上手いキャッチですねぇ)。
  •  Digital Land Grab(デジタル版陣取り合戦) - bookscanner記

    スキャナメーカーKirtas Technologiesとコーネル大学が、書籍をデジタル化するというMicrosoftの新プロジェクトWindows Live Book Search」で協業することに合意した。 ってニュースが10月19日付けでCNET Japanに出てんだけど、このニュースをどう読もっか。これまで伝えてきた内容と照らしてみるよ。 これって、当事者が3個いて、MicrosoftとKirtasとコーネルね。そんで、誰に注目しようか?ってことだけど、やっぱり「コーネル」だよね。 大量スキャンプロジェクト競争(狭義のDigital Land Grab)*1において、勝敗の鍵を握るのは、図書館だよ、きっと。そこんとこ、間違えんようにしないとね。もし、大量スキャンプロジェクトの行方だとか、現状どうなってんの、ってこと知りたかったら、各図書館(特に浮動票)の動きをちゃんと追っておかんと

     Digital Land Grab(デジタル版陣取り合戦) - bookscanner記
  •  Google揉め事を整理しましょ(2) - bookscanner記

    Googleの持ち出してきた「Subpoena」について話をしてんだけど、これって「Fair Useを立証するんだ」っていう建前とともに、「合法的にライバルのプロジェクトを丸裸にしてやる」っていう「裏」があるんじゃないか、って流れね。「裏」については、これまで何度か書いてきたから、今回は「建前」に集中ね。 Googleの主張は、「GoogleスキャンプロジェクトのIndexingはFair Useなんだ」ってこと。 そんで、「Fair Use」だってことを立証するためには、『こちら』でも紹介したように、4つのポイントがあるわけ。でもね、Jonathan Kerry-Tyermanさんも言ってるし、その他、いろんなやつ見たけど、結構、普通に受け入れられてる考え方として、 the fourth factor is generally regarded by both commentators

     Google揉め事を整理しましょ(2) - bookscanner記
  •  Google揉め事を整理しましょ(1) - bookscanner記

    Subpoena(ちなみに発音は「サ(sa)ピ(pi)ーナ(na)」ね)の話をしてんけど、ちょっとこれまでの状況を整理しといたほうが良いかも。でも、法律の専門家じゃないから、ほんとーに申し訳ないけど、あまり厳密に受け止めんといてね。でも、できるだけ、正確に伝えるようにがんばるよ。(あとtaninswさん、phoさん、コメントありがとう。分かりやすくするために、できるだけがんばるよ。だから、分からんときは、いつでも言ってね。) 以下の話は、いろんな資料から引っ張ってきてんけど、もしおおざっぱでいいから、ひとつにまとまってもんを読みたいってんなら、有料だけど『Should Indexing Be Fair Use? The Battle over Google Book Search』あたりがおすすめ。 大量スキャンプロジェクトで著作権がクローズアップされてんけど、著作権の観点から「スキャン

     Google揉め事を整理しましょ(1) - bookscanner記
  •  Googleのカウンターパンチ(Subpoena)をちゃんと見てみよう - bookscanner記

    Googleスキャンプロジェクトは、著作権問題で大きなダメージを受けたかのように見えてたよ。でも、Subpoenaは、起死回生のカウンターパンチになるんじゃないかなって考えてる。だから、Amazonシリーズ中断しとんよ。そんでこの記は、お茶を濁さんよ。Subpoenaを紹介した以上、ちゃんと中身も紹介する。 このSubpoena手続きの書類冒頭、 YOU ARE COMMANDED to produce and permit inspection and copying of the following documents or objects at the place, date, and time specified below (list documents or objects): See Schedule A PLACE: Yahoo! Inc., 701 First Avenu

     Googleのカウンターパンチ(Subpoena)をちゃんと見てみよう - bookscanner記
  •  「なか見!」の中身は、50,000冊 - bookscanner記

    昨年11月の記事(『アマゾン ジャパン、書籍の全文検索ができる“なか見!検索”のサービスを開始』)、 なか見!検索は、その名のとおりAmazon.co.jpで販売されている書籍の内容の全文検索を行なえる機能。検索キーワードがヒットしたページの前後をプレビューする“立ち読み”に相当する機能も持つ。(株)講談社など280社の協力を得ており、現在800万点前後の取り扱いがある書籍のうち13万冊以上をデータベース化しているという。これには海外サービスですでに提供されている洋書のデータも含まれているが、洋書・和書の割合、協力している出版社の内訳などは現時点で公開されていない。 さらに、今年5月に、谷口正晃さんの記事(『書籍全文検索サービス グーグル、日でも 』)、 昨年11月から販売する書籍の検索・閲覧サービス「なか見!検索」を始めたアマゾン・ドット・コムでは、「最初は13万冊が閲覧対象だったが、

     「なか見!」の中身は、50,000冊 - bookscanner記
  • bookscanner記 「誰が読むんだ?」ってものを、Googleだけはコツコツ読んでる

    の電子化について、いろいろ書いてるんだけど、この(日)記が一番言いたいことは、「グーグル(とかYahoo、MSNなど)がを電子化しているのは、人間が読むためじゃないよ」ってことに尽きる。この点は、かなり誤解されてて、というか過剰に期待されてて、Googleとかが公開する画像を見て、「あれじゃ、とても読めたもんじゃない」っていう人がいる。品質の問題もそうだし、そもそもオンラインで読むことについてもね。 でもね、 この記事にあるように、 Karen Coyle, consultant on digital libraries, somewhat ruefully commented: “Google themselves are the only ones with a clear idea of what they are doing and they state it. They ar

    bookscanner記 「誰が読むんだ?」ってものを、Googleだけはコツコツ読んでる
  •  『グーグルが本の電子化で狙う「うまみ」の正体は』に応える① - bookscanner記

    三上さんが、『グーグルの電子化で狙う「うまみ」の正体は』というエントリーで、この記で書いていることについて、かなり真剣に分析してくれた。正直言って、とってもうれしい。 だから、三上さんの書いた内容について、こっちも真剣に応える。 三上さんは、 の電子化によってGoogleが目指している当の目的は何か と自問する。 なんでかっていうと、 bookscannerさんは知ってて敢えて書かないような気もする (しかも)bookscannerさんが紹介するGregory CraneやKevin Kellyの意見に、その答えはない (さらに)人間を介在させないサイクルの実現例も、その種のサイクルによってGoogleが狙っている獲物は何なのかの答えにはなっていない (はたまた)「単にへのインデックスを作ってるんだよ。」と言われるその「インデックス」が何のためのものなのかは不明である というわけ

     『グーグルが本の電子化で狙う「うまみ」の正体は』に応える① - bookscanner記
  •  美崎薫さんと言えば、BTRONなんだそうだが... - bookscanner記

    美崎薫さんと言えば、巷では、BTRONというもので有名なんだそうだが、知らんかった。 そもそもBTRONというものを知らんかった。 私はてっきり、美崎さんと言えば、「記憶する住宅プロジェクト」の人なのだと、ず〜っと思ってた。少なくとも今年の初めくらいまでは。今は、「あ、美崎さんね、BTRONの人でしょ?」って言える。でも、いまだにBTRONについては、あまり知らず。 それはさておき、このヘンテコなプロジェクトを知った2003年っていうのは、私が勝手に「大量スキャンプロジェクト元年」って呼んでる年。なんでかって言うと、 2003年を振り返ってみると、 2003年3月3日、日がひな祭りで浮かれている中、米国の自動ブックスキャナ会社であるKirtas Technologies社が、突然、「来月、自動ブックスキャナを展示会に出すよ」って発表した。実際に展示会に出したんだけど、日人はあまり知らな

     美崎薫さんと言えば、BTRONなんだそうだが... - bookscanner記