Webサイトを保存するオンラインサービスは幾つもありますが、大抵はrobotsへnoarchive属性を付けておけば保存されません。 それを無視するサービスでも削除要求や「今後一切アーカイブしないでくれ」と行った要求が通るのでちょっと面倒なだけでした。 今回なぜarchive.isを知ってブロックする事になったかと言うと・・ 別件で過去3年分のサーバーアクセスログからリンク元一覧を作成していたら「archive.is」からのリンクを発見。 なにかなー?とリンク元をゲットしてみると、対象URLのデータ丸ごとアーカイブされていました。 コードを見てみると、GoogleAnalytics関連は無効化されているので余計なログは残らないしGoogleのポリシーにも違反しないのは良いところだけれど・・・ 元ページなんかを示すcanonicalタグは書き換えられていました。 まあどのサイトをキャッシュし