タグ

Archiveとscanに関するmyrmecoleonのブックマーク (17)

  • 国会図書館で提供するデジタル化資料が100万点超え、うち25万点はネットでも 

  • Internet Archive Canadaが資金難により75%のレイオフを敢行

    カナダのトロント大学ロバーツ図書館内にオフィスを構えるInternet Archive Canadaが資金難により75%のレイオフを実施したそうです。全47人のスタッフのうち33人が解雇され、資料のスキャンを担当するスタッフは27人から11人に減ったそうです。その結果、夜間の作業を実施することが難しくなり、スキャンのペースは月1,500冊から250冊に減少すると見られているようです。 Internet Archive Canada branch cuts 75% of staff (The VARSITY 2011/8/18付けニュース) http://thevarsity.ca/articles/46743 Internet Archive Canada Laying Off Most Staff (torontoist 2011/7/14付けニュース) http://torontois

    Internet Archive Canadaが資金難により75%のレイオフを敢行
    myrmecoleon
    myrmecoleon 2011/08/22
    「全47人のスタッフのうち33人が解雇」「スキャンのペースは月1,500冊から250冊に減少」
  • johokanri.jp

    johokanri.jp 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

    myrmecoleon
    myrmecoleon 2010/07/01
    やっとInternetArchiveの電子書籍方面も動きだしたか。
  • デジタル化した後の紙資料をいつまで保存するべきか

    電子ジャーナルのアーカイブ事業等を行っている非営利団体Ithakaが、デジタル化した後の紙媒体の雑誌をいつまで保存するかについてのレポートを公表しています。スキャンミスの修正、デジタル資料の保存問題等に対応するために、紙媒体資料も一定期間の保存が必要としており、例えば、上質のデジタル化がなされた文字のみの資料の場合には、最低一部を20年は保存する必要がある、としています。 What to Withdraw: Print Collections Management in the Wake of Digitization http://www.ithaka.org/ithaka-s-r/research/what-to-withdraw Ithaka Reports on How Long To Keep Print Journals(2009/10/1付けLibrary Journalの記

    デジタル化した後の紙資料をいつまで保存するべきか
    myrmecoleon
    myrmecoleon 2009/10/02
    「上質のデジタル化がなされた文字のみの資料の場合には、最低一部を20年は保存する必要がある」
  • 日本HPが最新技術で800年前の“国宝”を再現

    HPは、「現存の貴重な芸術文化財を保護するとともに、一般の人々の目に触れる機会の少ない作品を複製することにより、より多くの人々が文化財を理解する機会を持てるように」という趣旨のもと、同社が持つ最新テクノロジーを使って文化財の複製保護=デジタルアーカイブ事業をワールドワイドで手がけている。出力機器にHPのプリンタが使われている写真展や絵画展に足を運んだ人もいるのではないだろうか。 今回公開される「北野天神縁起絵巻(平成記録)」は、数ある天神縁起絵巻の中において現存最古(13世紀初頭)のもので、秘蔵の「根縁起」として尊ばれてきた、全9巻から成る国宝「北野天神縁起絵巻(承久)」の複製版だ。2008年2月に京都の北野天満宮に奉納され、「承久を平成20年に持ちうる最高の技術を使って記録した」として「平成記録」と名付けられた。複製作業では、3900万画素のハッセルブラッド製デジタルカメ

    日本HPが最新技術で800年前の“国宝”を再現
  • なんで圧縮の話してんの?小学5年生でも分かるように説明してください。 - simpleA記

    いきなり、JPEG2000だとか、LZWってなヘンテコ話をはじめて、「しんぷるは、とうとう発狂?」と思った方、ちょいとお時間よろしいですか?30秒で、ご説明します。 奥さん、要は布団圧縮パックですよ! (http://www.rakuten.co.jp/silknet/512825/566573/より画像を拝借してますので、ご購入の際は、ぜひ、このリンク先より。ちなみに、単にGoogleで「布団圧縮パック」って入れて出てきたってな関係です。) ってな感じで、パソコンの中の「データ」ってのも一緒。そのまんまだと、パンパンになっちゃうから、ペッタンコにして、たーくさん収納できるようにすんの。 でも、布団圧縮を使った場合、いざ使おうと思ったときに、元の「ふかふか」に戻らなかったら、ガックシだよね。同様に、画像データってのも、使おうと思ったときに、元の状態に戻ってくれないと困るわけ。 かと言って、

  • オンライン図書館の蔵書が100万冊を突破 | OSDN Magazine

    Universal Library Projectという国境を越えた壮大な取り組みによって、100万冊を超える書籍がデジタル化された形で無償提供されている。中国、インド、エジプト、米国の各研究者によるこの共同プロジェクトの最終目標は、すべての出版物のデジタル化、地理的および社会経済的な境界に縛られない情報参照の実現、技術的な発展基盤の提供、出版物の時流を超えた保存にある。 現在、中国語、英語、アラビア語、インドの各種言語など、20以上の言語にわたる150万冊の書籍が1つのWebポータルから参照できる。このオンライン図書館には、世界中の私有および公的なコレクションの希少書や絶版書も含まれる。 「著作権が切れて忘れられている書籍はたくさんあるが、研究者や学生にとっては有益なものであり、一般の人々にとっても役立つはずだ」と語るのは、著作権の専門家であり、米国カーネギーメロン大学でコンピュータサイ

    オンライン図書館の蔵書が100万冊を突破 | OSDN Magazine
    myrmecoleon
    myrmecoleon 2007/12/26
    Universal Library Projectの紹介
  • こちらの現状整理 - fuzzy Weblog@hatena (更新終了)

    http://d.hatena.ne.jp/simpleA/20071116#1195171267 超整理すると、こんな感じ。 何回かにわたり、いろんな切り口で、現状整理しまーす。 どんなときも、現状把握が大切。 切り口(1) ビジネスモデル 広告モデル Google 販売モデル Amazon系BookSurge 寄付金モデル Internet Archive ってなわけで、今日のところは、何が言いたいのかって言うと、「書籍の電子化にかかる費用を回収するモデルは、少なくとも3つあり、そのモデルに応じたスキャン対象書籍ってのがあるよ。そして、書籍のスキャン技術が浸透しつつある現在、新たなビジネスモデルが出現する可能性が高いよね。でも、残念ながら、日では新しいモデルの出現を待つって段階に到達してなくて、かなり遅れちゃってるから、もっと一緒にがんばろうよ」ってこと。 さて、上の3つのモデルは米

    myrmecoleon
    myrmecoleon 2007/12/12
    「Wikipedia風モデル (青空文庫風モデル)」「ニッチモデル(分野限定モデル)」
  • グーグルと慶大図書館の連携 : ニュース : 教育 : YOMIURI ONLINE(読売新聞)

    インターネット検索サービス大手のグーグルが貴重な書籍のデジタル化に乗り出した。7月に慶応大とデジタル化契約を結び、まずは大学の所蔵に狙いをつける。 大学は巨額の費用がかかる独自のデジタル化には及び腰で、グーグルとの提携は魅力的だが、文化財の囲い込みにつながりかねないという警戒感も根強い。 グーグルは既に、スタンフォード大、オックスフォード大、ニューヨーク公共図書館など26機関と提携した。図書館側が無償で蔵書をグーグルに貸し出して、グーグルをスキャン、デジタル画像として保存・公開する。 アジアで初めて提携した慶応大の場合も同様で、グーグルは、同大が所蔵する著作権の保護期間(著者の没後50年)が終了した蔵書12万冊を読み取り、デジタルデータ化して、自由に検索できるようにする計画だ。 慶応大はこれまでに数億円規模の予算を投じ独自に貴重10万ページ以上をデジタル化してきた。しかし、実績豊富

    myrmecoleon
    myrmecoleon 2007/10/03
    「国立国会図書館は「近代デジタルライブラリー」事業を進めているが、2007年度予算は8100万円、1万1500冊分」その大部分は著作権調査の費用だったような。「年間1000万円ほど」東大さすがだなあ
  • ロボットアームを駆使し、『イリアス』最古の写本を3Dスキャン | WIRED VISION

    ロボットアームを駆使し、『イリアス』最古の写を3Dスキャン 2007年6月11日 サイエンス・テクノロジー コメント: トラックバック (0) Amy Hackney Blackwell 2007年06月11日 米FARO社製スキャナー付きロボットアームを駆使して写の3Dスキャンを行なうMatt Field氏。 Photo: Amy Hackney Blackwell スライドショーはこちら(英文) 図書館の棚で千年以上も埃をかぶっていたホメロスの叙事詩『イリアス』の最古の写が、間もなくデジタル化され閲覧できるようになる。 16世紀から続くベネチアの図書館を研究チームが訪れ、10世紀のものと見られるこの写の超高精細3Dコピーを作成した。ロボットアームに取り付けたレーザースキャナーによって、写に残るあらゆるシワや欠損までもが写し取られている。 写は羊皮紙を用いており、全645ペ

    myrmecoleon
    myrmecoleon 2007/06/11
    技術と人文学の極地。素晴らしい/古資料でフラットヘッド使うのはもちろん論外。
  • マイソール大学、Googleと古代文書のデジタル化を計画(インド)

    インドのマイソール大学(Mysore University)はGoogleとともに、大学が所蔵する紀元前からの文書8万点をデジタル化し、Google Book Searchで提供する計画を進めているそうです。 Google to Digitize Ancient Texts at University in India http://chronicle.com/news/article/2345/google-to-digitize-ancient-texts-at-university-in-india Google to digitise 800,000 books at Mysore varsity http://mangalorean.com/news.php?newstype=local&newsid=44056#

    マイソール大学、Googleと古代文書のデジタル化を計画(インド)
    myrmecoleon
    myrmecoleon 2007/06/04
    ああ,あれ古文書なんだ。ちゃんと英文読んでなかった。
  • PC

    パソコンの断・捨・離 いいことずくめのアプリ断捨離、不要なサブスクや悪意あるアプリも排除 2024.03.15

    PC
    myrmecoleon
    myrmecoleon 2007/04/10
    近代デジタルライブラリー等。電子化はデジカメで一点ずつ撮影。まあそりゃそうだ。
  • スキャン終了まであと1800年 - bookscanner記

    (必読)ニューヨークタイムズっていう有名な新聞に、『History, Digitized (and Abridged)』ってなタイトルの記事がでてたよ。http://www.nytimes.com/2007/03/10/business/yourmoney/11archive.html?ex=1331355600&en=ac8d2f50c8dfc12d&ei=5124&partner=permalink&exprod=permalink 今日は、その中から一つ。(明日も、もう一つ。(時差の関係上、あさってになっちゃったけど)) この図をみよー。クリックすれば、元のおおきなやつ見れるよ。 右上の方を見ると、Mission Impossibleってコーナーがあるでしょ。 そこによると、米国公文書館(The National Archive)には、90億点の「TEXT RECORDS(書類みたい

    スキャン終了まであと1800年 - bookscanner記
    myrmecoleon
    myrmecoleon 2007/03/12
    おー,わかりやすい。
  •  8畳にはサンデー14,000冊まで - bookscanner記

    (プラプラと旅してたので、ちょっとしたブランクがあったけど、「捨てる」の続きね。) (サンフランシスコなんで)坂道を登りながら、こう考えた。 を捨てれば悔やまれる。捨てずに残せば床抜ける。 兎角に人の世は住みにくい。住みにくさが高じると、安い所へ引き越したくなる。どこへ越しても住みにくいと悟った時、 床の増強に走る。というわけで、今日は、捨てたくても捨てられない、でも床が抜けるのも困る、ってな欲張りな人向け。 さて、木造の床は、何冊のまで耐えられるのか?http://oshiete.homes.jp/kotaeru.php3?qid=2537813こちらを信じる限り、8畳の部屋なら、最低2,400kgまでは耐えれるように設計するらしい。(ちなみに、「豊島区の底抜けおじさん」は、最低でも6,000kgは溜め込んでたらしいよ。部屋の広さに関して情報見つからんけど、20畳以上の部屋であるわけ

     8畳にはサンデー14,000冊まで - bookscanner記
    myrmecoleon
    myrmecoleon 2006/12/04
    ストレージの問題は,こと個人がやる分にはあまり考えないでいい気がする。毎年同価格で倍の容量が入手できますし。
  •  大量スキャンプロジェクトにおいて、ダブりなどない② - bookscanner記

    9月11日に書いたものの続編。 前回の要約 出版された当時は「同じ」だったものが、汚れたり、書き込みされたり、折られたり、切られたりして、もはや「スキャン」上「同じ」とは言えないようになってる という感じで、の状態に注目して「の大量スキャンプロジェクトにおいては、ダブりなんてないよ」ってことを主張してみた。 今回は、仮にの状態が全く同じだったとしても、それでも「ダブりなんてないよ」ということを見てみる。特にスキャン画像の傾きとOCRについて注目してみるよ。 fuzzy2さんが、家庭用スキャナとOCRで、小説『涼宮ハルヒの憂』(結構、いろんなところでこの小説の話題を目にするんだけど、いまだに読んだことがない、お恥ずかしい限り。)を電子化して、OCR結果を検討してる。必見。 http://d.hatena.ne.jp/fuzzy2/20060916/p1 http://d.hate

     大量スキャンプロジェクトにおいて、ダブりなどない② - bookscanner記
  • Internet Archive、1日200冊、年間予算2億円 - bookscanner記

    Internet Archiveでどんな作業が行われているのか、を紹介する。(詳細を知りたい人は、こちらを。) 昨日、オークランドに10台のマシンを並べて、スキャン作業をしていることを書いた。 各マシンは、1時間あたり500ページのスキャンをする。 オペレータは2交代制で、1日の時間は14時間。(一人8時間勤務で、途中休憩1時間だと思う。) 1台あたり、1日7,000ページをスキャンすることになる。 10台あるので、1日70,000ページ。 だいたい、こういう場合、1冊は350ページくらいと想定するのが相場なので、1日200冊が電子化されていく。 まぁ、だいたい年間に300日くらいあるので、1年で60,000冊。 彼らの予算は、1冊あたり35ドルくらいなので、年間210万ドル。日円で約2億円かな。 前に、某S大学が800万冊の蔵書を全てスキャンする予算として、270億円くらいだと言ってい

    Internet Archive、1日200冊、年間予算2億円 - bookscanner記
  • bookscannerの日記 1冊40分

    Internet Archiveの作業は、予定では1日200冊なのに、実際は1ヶ月400冊というペースでしか進んでいないことを紹介した。 今日は、なんでそんなに遅いのか、もう少し詳しく見てみる。 1ヶ月だと、だいたい稼動日として20日ある。すると、1ヶ月400冊というのは、1日あたり20冊。前にも書いたが、マシンは10台あるので、1台あたり1日2冊。しかも2シフトであることを考えると、早番の人は7時間かけて1冊、遅番の人も7時間かけて1冊、って計算になる。 当にこんなことをしているのか、詳しく調べてみた。 幸い、Internet Archiveは、何でも情報公開するオープンな会社。調べようと思えば、何でも分かる(気がする)。 この、ページ数としては400ページだが、約40分でスキャン作業を終えている。 なんでこんなことが分かるかというと、 まずこのページに行って、 画面左側にある「Al

    bookscannerの日記 1冊40分
    myrmecoleon
    myrmecoleon 2006/08/14
    Internet Archive の本のスキャン作業についての検証。
  • 1