タグ

ブックマーク / bookscanner.hatenadiary.org (83)

  • 出発しまーす - bookscanner記

    突然ですが、新天地へ向け、出発でーす。というわけで、bookscanner記は、終了でーす。 みなさん、これまでいろいろとありがとう。またいつか、どこかで、別な「マニアック(ニッチ)な」もんを書きはじめるかもしんないので、発見したら、お付き合いしてね。トピックは違えど、書きっぷりは一緒にすんよ。 というわけで、最後に何を言いたいのかっていうと、ありきたりなんだけど、 コロンブスのアメリカ発見について、そもそも彼の偉大な点はどこにあるか・・・ それは西回りのルートでインドへ旅行するのに、地球が球形であることを利用しようというアイディアではなかった・・・このアイディアはすでにほかの人々によって考えられたものであった・・・ 彼の探検の慎重な準備、船の専門的な装備などということでもなかった。それらのことは、ほかの人でもやろうとすればやれたに違いない。 そうではなくて、この発見的航海で最も困難であっ

    出発しまーす - bookscanner記
    myrmecoleon
    myrmecoleon 2007/04/12
    お疲れさまでしたー。またどこかで
  • Google Book Searchと著作権 - bookscanner記

    GBS関連のまとめ記事が、最近増えてきた。かなりあやしいー。何かたくらんでる。 というわけで、今日は、一番最近のまとめ記事をご紹介。 『Google Book Search Libraries and Their Digital Copies』 by Jill E. Grogg, Electronic Resources Librarian, The University of Alabama Libraries and Beth Ashmore, Cataloging Librarian, Samford University http://www.infotoday.com/searcher/apr07/Grogg_Ashmore.shtml まず、GBSに参加してる図書館ってどこだっけ?最初は5つだけだったから、全部覚えてたけど、どんどん増えて、今じゃ、一体いくつあんのかさえ、分から

    Google Book Searchと著作権 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/04/09
    ああ,図書館によってもポリシー違うんだ。全部OKなのは軒並み大学図書館かな?
  • 1億円あったら、何できる? - bookscanner記

    (ちなみに、日は4月1日だけど、アメリカはまだ3月31日なんで、下記内容は、ウソじゃな〜い。) 「あるわけないけど1億円あったらどうする?」(http://www.1oku-life.com/)ってなサイトがある。ちなみに、アメリカで90万ドル(約1億円)を銀行預金したら、毎年45,000ドル(500万円くらい)の利子がくっついてくんので、家族4人、豪遊できる(かも)。 そんなことはさておき、の電子化の話をしましょ。しかも、1億円プロジェクトのこと。 Google Book Searchは秘密ばっかでつまんない。なーにも教えてくんない。ケチ。 逆に、Internet Archive系列のOpen Content Allianceは、なーんでも話をしちゃう。太っ腹。(でも、あんまし誰も詮索しない。派手さにかける。) 関係者の人が、ぺらぺら、ぺらぺら、あっちこっちでしゃべってんのに、誰も詮

    1億円あったら、何できる? - bookscanner記
    myrmecoleon
    myrmecoleon 2007/04/02
    「間接的な費用をどこまで盛り込むのか、ってことで、いくらにでもできちゃう」ブックスキャンの現場について
  • ネットで「本」を読む? - bookscanner記

    むかーしに、「ネットで「」を読みますか?」ってなことで、いろんな人が、いろんなこと言ってた。 http://slashdot.jp/askslashdot/article.pl?sid=04/09/25/083204 とりあえず、これは「ネット読書」に関する古典だと思ってるよ。必読。 あれから、ずんどこ時代はかわり、みんなは今、果たして「ネットで「」を読む」んかな? まぁ、さっきのSlashdot記事をぜーんぶ読めば、たいていの、賛成・反対意見はモーラされてんので、とりあえず一安心。 ところが、こーんなところで安心して、油売ってる場合じゃない。時代はかわった(らしい)。 何が変わったかって言うと、今ネットでを読まん理由があるとすっと、それはもはや、「モニタが見づれー」とか「電池がどーのこーの」なんて問題じゃなくなってる(面がある)。 そんなわけで、「ネットで」に関する「2007年の

    ネットで「本」を読む? - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/27
    ネットはそもそも長文を読むのに適してない,という話。
  • Wikipediaをどーやって使おっか? - bookscanner記

    前回、Amazonが「Citation」ってな感じで、のパクり関係を教えてくれる、って話をした。これって、Amazonの商売の面で言うと、新たな「リコメンド」機能だよね。 そんで、リコメンドつながりってことで、 http://www.newscientisttech.com/article/dn10849-wikipedia-links-used-to-build-smart-reading-lists.html この記事の中で、米国コーネル大学のJon Kleinbergさんが、 "One can try to exploit a different analogy, viewing Wikipedia as a system where many editors express interest in topics by editing pages," he says. "In th

    Wikipediaをどーやって使おっか? - bookscanner記
  • Amazonで「本が本を読む」様子でもみましょ - bookscanner記

    前に、の電子化の「あっち側」ってことで、電子化した画像(+OCRデータ)使って、何やりたいのか、ってのを少し考えた。 http://d.hatena.ne.jp/bookscanner/20060814 一方、「こっち側」の話は、要はインターフェースの問題だよね。見やすいよーに、ってこと。でも、何度か言ってるけど、こんなのおもろくもなんともない。所詮、「みにくい」んだよね。どーんなにがんばったって。 だから、やっぱおもろいのは、「あっち側」。 そんで「あっち側」で、アメリカ(あたり)の優秀(かもしんない)頭脳がたーくさん集まって、血眼になって、何をゴソゴソやってんのか、っちゅうと、 「あるに違うを読ませて、自分の中の文章がどこに出てくんのか、自分の中の文章がどっから来たのかってのを探してる」わけ。そんなことして、何になんのか、ってのは、また近い将来詳しく見ていきたいけど、とりあえず、

    Amazonで「本が本を読む」様子でもみましょ - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/20
    おお。全文検索で自動的に引用・被引用を分析してるのか。すごいな/Amazonの説明を読むと,マジで文中のテキストをマッチングさせてるんね。これはいい,というかマジで日本語版が欲しい。
  • どーやってページをめくりましょ? - bookscanner記

    今日は、ユーザーインターフェースについて、考えましょ。(人間が読むために電子化してんじゃないんだけど、それでも、どーせなら読んでみたいよ、ってのが世の常。そんで、読む以上、読みやすいよーにせんとあかんわけ。だから、なにげに、インターフェースは重要だよん。) http://www.flib.jp/ってのがあるでしょ。これって、雑誌とかがタダで見れるので、得した気分。でも、ひとつだけ、疑問。ページのめくる音ってホントーに必要かな?その前につけなきゃいかん機能があるんではないかな。 まぁ、何はともあれ、このflibってのは、カレントを、便利に見せましょ、ってインターフェースね。開発途上のシステムということで、多少の問題を大目に見たとしても、デキが悪い(よーな気がする)。関係者の方、怒らないでね。 私のオススメを紹介しましょ。こっちはアーカイブの閲覧用インターフェースね。 http://archi

    どーやってページをめくりましょ? - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/16
    うを,なんだこれ。こんなすごいのがあったのか……/機械的にじゃなくて実際に撮影してアニメーションさせてるっぽいから,手間は死ぬほどかかってるんだろうがw
  • 一体Googleはいくら使ったの? - bookscanner記

    さて、昨日に引き続き、ニューヨークタイムズの記事をみましょ。昨日とセットで見てね。 http://www.nytimes.com/2007/03/10/business/yourmoney/11archive.html?ex=1331355600&en=ac8d2f50c8dfc12d&ei=5124&partner=permalink&exprod=permalink この記事によると、 In its quest to scan every one of the tens of millions of books ever published, Google has already digitized one million volumes. Google refuses to say how much it has spent on the venture so far, but ou

    一体Googleはいくら使ったの? - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/13
    「「Googleはコストの話を完全シャットアウトしてんので、一体いくらでやってんのか、なんて分かりゃしないよ」ほー,5ドル説まで出てきたのか。
  • スキャン終了まであと1800年 - bookscanner記

    (必読)ニューヨークタイムズっていう有名な新聞に、『History, Digitized (and Abridged)』ってなタイトルの記事がでてたよ。http://www.nytimes.com/2007/03/10/business/yourmoney/11archive.html?ex=1331355600&en=ac8d2f50c8dfc12d&ei=5124&partner=permalink&exprod=permalink 今日は、その中から一つ。(明日も、もう一つ。(時差の関係上、あさってになっちゃったけど)) この図をみよー。クリックすれば、元のおおきなやつ見れるよ。 右上の方を見ると、Mission Impossibleってコーナーがあるでしょ。 そこによると、米国公文書館(The National Archive)には、90億点の「TEXT RECORDS(書類みたい

    スキャン終了まであと1800年 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/12
    おー,わかりやすい。
  • みんなでスキャン① - bookscanner記

    世の中、「ネット+分散」がはやり。当然、スキャン作業もみんなでやろうと思うわけ。たとえ世界中に1億冊のがあろうが、1億人が1冊づつスキャンすれば、すぐ終わる(はずなんだけど)。 はるか昔に、http://d.hatena.ne.jp/bookscanner/20060819で、校正作業をみんなでやりましょ、っていう「Distributed Proofreaders」なる団体を紹介したよね。そっちの方は、(Googleスピードで考えると、とんでもなくおそーいペースだけど、ふつーの電子化プロジェクトとして考えると)比較的順調に進んでんだと思う。 ところが、 「みんなでスキャン」計画ってのは、あんましうまくいかん。なんでうまくいかんのかっていうと、「」っていう物理的なモンが関わってるからだよね。まぁ、そーなんだけど、たとえうまくいかんでも、試みることはすばらしい!というわけで、2回にわけて、

    みんなでスキャン① - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/07
    「2冊スキャンしてくれんなら、送料だけで、スキャナあげちゃいます」面白いけど,やっぱりどこにデータが流れてるかわからんてのが怖いな。
  • 「うわづら文庫」と「青空文庫」 - bookscanner記

    前に、スキャンされたデータは、画像派/文字派/しかたなく画像派に分かれる、って話をした。 http://d.hatena.ne.jp/bookscanner/20070222/p1 http://d.hatena.ne.jp/bookscanner/20070223/p1 (ご人はどー思ってんのか知んないけど)日の代表的「しかたなく画像派」は、 岡島昭浩さんの運営する「うわづら文庫」かな。 主人の岡島さん曰く(http://www.let.osaka-u.ac.jp/~okajima/uwazura.html)、うわづら文庫 (別名「責空文庫」)というのは、 青空文庫への敬意を表した命名です。青空文庫がテキストファイルを提供し、さまざまな環境で読めるのに対し、この「うわづら文庫」はテキストではなく画像で、すなわち上面だけのものだ、という意味です。(別名の「責空文庫」(せめぞらぶんこ)と

    「うわづら文庫」と「青空文庫」 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/05
    「「しかたなく画像派」と文字派は、これからも仲良しなんだろーと思うよ」
  • 50万冊捨てたわけ - bookscanner記

    昨日、アベブのブログに載ってた「50万冊のを捨てちゃって、みんなから攻められてる市政府」てのを紹介したけど、ちょっと思うところあって、も少し詳しく伝えておくね。 これは、捨てられちゃったをバックに(記念)撮影してる元持ち主(経営してた古屋が倒産しちゃった人ね)。*1 http://www.cyberpresse.ca/article/20070213/CPACTUALITES/702130568/より拝借 復習しておくけど、話としては、 古屋が家賃払えなくて追い出された。そんとき、残された50万冊のを市が回収して、一時保管してたんだけど、引き取ってくれそーな人がいないので、捨てた。そしたら、環境団体が「なんで、リサイクルに回さないんだ!」って怒ったらしい。他にも、「学校とかに寄付しろよ」とか文句言われてるらしい。 ということ。 どんくらい怒ってるかっていうと、http://car

    myrmecoleon
    myrmecoleon 2007/03/02
    日本ではこういう事例もあるんだけど→http://kumanichi.com/news/local/index.cfm?id=20070223200016&cid=main/桁はひとつ違うけど,もし日本で同じことが起きても図書館や人々に分配できる機運はあると思う(仕組みはまだない)。
  • アベブのブログ - bookscanner記

    でも知ってる人が多いだろーけど、「古探すなら、Abebooks!」(http://www.abebooks.com/) このアベブ*1に関連して、彼らのブログを知ってる? に関して、いろいろとおもろいことを書いてんだけど、いくつか最近のもんを紹介しておきましょ。http://abebooks.wordpress.com/ まず、2月14日の「500,000 used books trashed」によると、古屋が家賃払えなくて追い出された。そんとき、残された50万冊のを市が回収して、一時保管してたんだけど、引き取ってくれそーな人がいないので、捨てた。そしたら、環境団体が「なんで、リサイクルに回さないんだ!」って怒ったらしい。他にも、「学校とかに寄付しろよ」とか文句言われてるらしい。 元:http://www.canada.com/montrealgazette/news/stor

    アベブのブログ - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/01
    電子化というか,資料保存とかだとそっちのほうが専門なわけですが。
  • 規模のはなし - bookscanner記

    *1 電子化プロジェクトの規模に関して、3つくらいの分け方があるよ。 並 (普通、何もつけず、"Digitization") 大 ("Large Scale Digitization") 特大 ("Mass Digitization") おおざっぱに考えれば、 並:100冊くらい 大:10,000冊くらい 特大:1,000,000冊くらい ってな感じなので、適当に分類しといてね。*2 そんで、規模に関して、勘違いされがちなのが、コストのこと。かなりおおざっぱに理解すっため、かなり極端な話をすっと、「プロジェクトの規模に関係なく、総予算は変わらん」わけ。 つまり、 並:100万ドルくらい 大:100万ドルくらい 特大:100万ドルくらい となる。 なんでかっていうと、「並プロジェクトでは、たった100冊しかスキャンできないんだから、スキャン対象は、厳選に厳選を重ねた挙句、さらに厳選をして、

    規模のはなし - bookscanner記
    myrmecoleon
    myrmecoleon 2007/02/26
    並はそれこそ10冊くらいからある気がするのですが。以前その手の仕事したときは,さすがに100万ドルはかからなかったな。
  • 「しかたなく画像派」 - bookscanner記

    前回、画像派/文字派って区別ができる、って話をした。 そんで、画像派の特徴は「画像でなきゃ意味がない」ってところにあって、かなりすっきりしてんだよね。 ところが問題は、文字派で起こるわけ。 電子化の過程で、文字派が直面する問題ってのは2つあって、 手作業による文字入力ってはかなり大変で、疲れちゃう かといって、OCRってのも、結構あてにならん ということ。 ならば、出版社からデータをもらいたいところだけど、Y氏によると、 書籍の製作過程が、ほとんど電子化されていると言っても実はそのデータが残っていない。また残っていてもそこから電子書籍をつくるのは大変な苦労がかかる。外字の問題もあるしテキストデータの吸い出しにも問題がある。それではを電子化するまでで息切れを起してしまいます。*1 ってな感じ。 こんなもろもろの事情から、「当は文字データとしてやりたいんだけど、しかたないから、画像でがまん

    「しかたなく画像派」 - bookscanner記
  • 画像派と文字派 - bookscanner記

    電子化されたデータに関連して、2つのグループがある。画像派と文字派。とりあえず、簡単なところから、攻略していきましょ。 画像派ってのは、を電子化するときに、画像としてとっておくことに意味があるケース。例を2つほどみてみましょ。 一つ目は、ミズーリー州立植物園が、植物の挿絵なんかを、普通の名前(「チューリップ」とかふつうにみんなが呼ぶ名前)と、学術名(「Tulipa sylvestris」みたいによーわからん長い名前)の両方から検索できるよーにした、ってプロジェクト。この場合、単純明快、画像が重要だよね。 http://www.illustratedgarden.org/mobot/rarebooks/page.asp?relation=QL551G3S651797V1&identifier=0074 二つ目は、日の明星大学がやってるプロジェクトで、シェークスピアのフォリオを電子化してる

    画像派と文字派 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/02/22
    「さすが携帯後進国のアメリカ。日本ほど、すごくない」おいおいw/次回の派生が気になる。
  • カレントとアーカイブ - bookscanner記

    の電子化」ってのは、ある意味ブームだから、みんな、なんとなく分かってる。でも、「なんとなく」だから、いろんなことがごっちゃまぜになってて、ときたま、混乱してるよーに見える人がいるよ。 今回から数回にわたって、「電子化」にまつわる分類を、いくつか紹介すんね。いつものごとく、厳密さよりも、分かりやすさを優先してんので、大きな心で受け止めてね。そんで、少しでも混乱が晴れてくれればいいんだけど、もし余計混乱しちゃったら、カンベンね。 今日は、タイトルどおり、カレントとアーカイブ。 「の電子化」と言っても、二つあって、カレントとアーカイブ。言い換えると、「電子形態での出版」と「既存の電子コピー作成」かな。 ってのが、最近の口癖。口にタコができた。 この資料の図を見ると、わかりやすいよーな気がするよ。(じゃなくて、学術雑誌についてだけどね。) かなり、おおざっぱに言えば、これから出すもんは、

    カレントとアーカイブ - bookscanner記
  •  「表紙がこういう色で・・・」 - bookscanner記

    『ブログ発!カバーの色で検索するOPAC』 http://www.dap.ndl.go.jp/ca/modules/cae/item.php?itemid=619 ってことで、色でを検索しよーって話が進行中。 国会図書館の情報キャッチの早さにはタマげたんだけど、さらに驚いたのは、 「表紙がこういう色で・・・」という表現で,図書の検索を依頼された経験を持つ図書館員は,少なくないだろう。 という出だし部分。そんなことになってたなんて、知らんかった。 結構おーきな衝撃うけて、そんで思い出したのが、「巨乳史」を語るmmpoloさん。彼が前に、「題名の分からない」というエントリーで、 最後のシーンだけ覚えていて、失恋した青年が海中にやっと頭を出している岩に座ってじっとしている。やがて潮が満ちてきて青年は座っている岩もろとも海中に没するという話だった。 (中略) 誰かご存じの方がおられたら教えてほ

     「表紙がこういう色で・・・」 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/02/17
    その手の需要は公共の方が多いんですけどね。大学では逆に,存在するかもわからない本の探索を依頼されますorz
  • bookscanner記 - 図書館33を読んで

    最初に、「図書館がまだまだイケてる33の理由」*1ってのを読んだとき、10番目くらいまで律儀に読んで、「ずいぶんと長いな。しかも、図書館の存亡に結びつかん項目もあったり、前後のつながりがよー分からんもんが混じったりしてんな。Will Shermanさんってのは、何モンだ?」って思って、読むの止めちゃった。最近、飛行機ん中で暇だったから、読んでみたよ。 そんで、感想としては、こんな感じ。 1.の電子化に絡んで、図書館がなくならん理由はたった1つ。「だって、電子化してる側が、そのつもりでやってないもん。」 図書館の代わりになるよーなもんを作らんといかんとしたら、もうちょっと違うことせんといかんわけ。はなっから、図書館の代替だとは思ってないのはもちろん、図書館の補完だとも思ってないよーな気がすんのは、私だけかしらん?電子化組が図書館の扉をたたいてんのは、そこにがいっぱいあるから。それだけだよ

    bookscanner記 - 図書館33を読んで
    myrmecoleon
    myrmecoleon 2007/02/16
    「だって、電子化してる側が、そのつもりでやってないもん。」疑心暗鬼多すぎですよねー>33
  •  図書館に関係ある人、大集合 - bookscanner記

    旅から帰ってきたよ。ただいま。 さっそく、こちらをご覧あれ。 http://161.112.232.18/hotlinks.php 「ちょっと多すぎて、数える気がしないなー」と思いつつ、数えたよ。さっきだと、444個あった。人いわく、466個あるっていうんだけど、444しかないよな。ただ、日々是変わるため、明日はもう違うかも。*1 これは、あるひまな人*2が、図書館ってのに、ひろーい意味で関係ありそなブログを集めてるもんだよ。 そんでもって、こちらが、この大集合のタグクラウドなんだって。 http://161.112.232.18/hotstuff.php 緑で書いてあんのは、過去にあんまし使われてない言葉なんだそーで、作った人曰く、「緑になってるやつは、新しいトレンドかもしんないぜ」ってことらしい。 というわけで、結局何が言いたいのかっていうと、「大半のタグは、意味ねぇー。なんだよ、

     図書館に関係ある人、大集合 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/02/15
    どこだったかで確か図書館ブログのリスト作ってたような。タグクラウドはなかったけど。/自分が購読してる図書館関係ブログのリストなら放出してもよいけど。図書館とは直接関係ないのも混じって130個くらい。