ウェブアーカイブでは、収集ロボット(クローラ)と呼ばれる自動プログラムを用いてウェブサイトを収集します。(参考:ウェブアーカイブのしくみ > 3. ウェブを収集するしくみ) しかし、現在WARPで使用している収集ロボットでは一部収集できていないページやファイルがあります。今回はそのような例をご紹介します。 (以下の内容は、2017年11月時点でWARPが採用している収集ロボットの仕様や設定をもとにしたものです。) 別サーバに置かれたファイル WARPでは、ウェブサイトの単位(タイトル)ごとに収集の開始ページを登録し、この開始ページからリンクをたどって収集を実施しています(開始ページは複数登録可能です)。このとき、登録した開始ページと同じサーバ上にあるファイル(URLの"○○○.go.jp"の部分が開始ページのURLと共通のもの)のみを収集します。登録していないサーバへのリンクはたどらず、フ