We tried to load scripts but something went wrong. Please make sure that your network settings allow you to download scripts from the following domain: https://id-frontend.prod-east.frontend.public.atl-paas.net
WaybackはWARCフォーマットで保存されたウェブアーカイブを表示するためのツールです。米国の非営利団体インターネットアーカイブは収集したウェブサイトを閲覧できるようWayback Machineというサービスを提供しており、そのオープンソース版がWaybackです。インターネットアーカイブを中心として開発が進められてきました。 特徴 Waybackを使うと、Heritrixなどのクローラで収集されたWARCフォーマットのアーカイブを表示することができます。つまり、収集時点のウェブサイトをブラウザで閲覧することができます。なお、WARCフォーマットが国際規格化される以前に使われていたARCフォーマットにも対応しています。 WaybackはJava言語で開発されているオープンソースソフトウェアです。ソフトウェアライセンスとしてApache License, Version 2.0を採用し
「Heritrix」は数あるクローラの中の1つです。クローラは、「ロボット」や「ボット」と呼ばれることもあります。 https://webarchive.jira.com/wiki/display/Heritrix/Heritrix クローラとはインターネット上のウェブページを巡回し、画像やPDFファイルなどを自動的に集めてくるプログラムのことをいいます。GoogleやBingなどの検索エンジンは独自に開発したクローラを使って、インターネット上の情報を収集し、それらを検索できるようにしています。 Heritrix は、インターネットアーカイブや国立国会図書館のWARPをはじめとして、大英図書館(British Library)、米国議会図書館(Library of Congress)など、世界中の国立図書館のウェブアーカイブ事業で使用されています。 特徴 HeritrixはJava言語で開
ウェブアーカイブでは、ウェブページから収集したファイルをそのまま保存するのではなく、ウェブアーカイブに適した保存用ファイルフォーマットにして保存します。その理由としては、収集時の情報やファイルのメタデータが同時に保存できるため長期保存対策が可能であること、差分収集に対応しているフォーマットであることなどが挙げられます。 WARCファイルとは WARCは世界のウェブアーカイブ機関で広く採用されている保存用ファイルフォーマットで、その名称は「Web Archiving」に由来します。IIPCの主要メンバーであるインターネットアーカイブが採用していたファイルフォーマットARCをもとに、2004年にIIPCにより汎用的に使える形式に拡張されました。 2009年5月には、国際標準機構(ISO)の国際規格ISO 28500:2009となっています。 (参考) IIPCのウェブアーカイブ保存形式"WAR
2015年IIPC総会<報告> ウェブアーカイブに関する連携を目的とした組織である「国際インターネット保存コンソーシアム(IIPC;CA1664参照)」の総会が,2015年4月27日から5月1日まで,米国カリフォルニア州にあるスタンフォード大学とインターネット・アーカイブを会場にして開かれ,世界各国の図書館員やアーキビスト,研究者等約200名が参加した。ウェブアーカイブを利用した研究の成果やIIPCが進めるプロジェクトの最新情報等について報告があり,活発な議論が交わされた。 報告の内容は多岐にわたったが,議長のワーグナー(Paul Wagner)氏(カナダ国立図書館・文書館)が「最近の議論の焦点はウェブアーカイブの利活用に移ってきている」と指摘したように,ウェブアーカイブの,特に研究利用という視点からのものが目立った。 英国の“Big UK Domain Data for the Arts
情報組織化研究グループ月例研究会報告(2013.5) インターネット資料収集保存事業(WARP)の10年とこれから 前田直俊(国立国会図書館関西館) 日時: 2013年5月18日(土) 14:30~17:00 会場: キャンパスポート大阪(大学コンソーシアム大阪) 発表者 : 前田直俊氏(国立国会図書館関西館) テーマ : インターネット資料収集保存事業(WARP)の10年とこれから 出席者: 安東正玄(立命館大学)、稲葉洋子、上野芳重(大阪市立大学)、大西賢人(京都大学)、川崎秀子(佛教大学)、川瀬綾子、河手太士(静岡文化芸術大学図書館)、篠田麻美(国立国会図書館)、田村俊明(紀伊國屋書店)、中村恵信(神戸松蔭女子学院大学)、堀池博巳、松井純子(大阪芸術大学)、水野翔彦(国立国会図書館)、村上幸二(奈良学園小学校)、村井正子(日本アスペクトコア)、横谷弘美(大手前大学)、吉川直樹(京都府
英国では、1662年から続いている納本制度により、これまで印刷された出版物の献本が義務付けられていたが、4月6日以降電子書籍などデジタルコンテンツも献本するよう改訂された法定納本制度が施行される。 2000年1月からデジタルコンテンツの自主的な献本が推奨されていたが、2002年10月の報告によれば、単行の電子出版物では75%、逐次刊行のものでは45~50%の収集にとどまったため、デジタルコンテンツも納本制度に組み入れることに踏み切った。これにはUKドメインの480万のWebサイト・ブログや電子ジャーナル、CD-ROMも対象になる。 納本制度は、国内の出版物を網羅的に収集し、利用できるようにするとともに、後世の人々のために保存するという目的がある。 電子書籍などデジタルコンテンツは容易にコピーが可能なため、出版者から販売が減少するなどの悪影響を懸念する声も上がってきている。このため同制度では
福島原発事故独立検証委員会(民間事故調)に続く第二弾「危機管理プロジェクト」の成果『日本最悪のシナリオ 9つの死角』が3月15日に刊行されました『日本最悪のシナリオ 9つの死角(新潮社より3月15日刊行)』(¥1,470-) 詳細はこちら Amazonで購入 「危機管理」プロジェクトは、財団法人日本再建イニシアティブの最初のプロジェクトである「福島原発事故独立...続きを読む 理事長・船橋洋一が「カウントダウン・メルトダウン」(1月25日発刊)の発表記者会見を行いました。3月7日(木)、当財団理事長・船橋洋一が日本記者クラブ主催の研究会「著者と語る」にて会見致しました。 福島第一原発事故直後の意思決定過程を描いた「カウントダウン・メルトダウン」(1月25日発刊)について、本の概要や特に読...続きを読む CLSA Japan 2013パネルセッション 出演2月27日(水)に危機管理プロジ
■ 「後世に残る」のは紙か、電子か。 偶然だと思うが、「本(や資料)を後世に残す」という同じキーワードが踊る記事を立て続けに読んだ。ひとつは日経ビジネスオンラインの「“ブックオフビジネス”は業界全体で取り組むべき」で、古本業界の「目利き」がチョイスした本だけをデジタルアーカイブせよという提言。つっこみどころは色々あるがたぶんログインしないと最期まで読めないと思うので、一部だけ引用: オンデマンド印刷技術も進化して、トナーの定着率の向上を果たしているが、それでも、紙にインクを吸い込ませるオフセット印刷に比べたら耐久年数には雲泥の差がある。1万年前のアルタミラの洞窟の絵が残されているように、自然物に溶けこんで記録されたデータの方が、はるかに過酷な年月に耐えうるのだ。 古代の壁画はべつに目利きが優れた作品を意図的に残したわけじゃなくて、たくさんあった壁画のうち、破壊や日照を免れて、かつ現代人が目
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く