suthioのブックマーク / 2017年1月6日

アーカイブ拒否を無視するarchive.isをブロックする – REIMA's Blog

Webサイトを保存するオンラインサービスは幾つもありますが、大抵はrobotsへnoarchive属性を付けておけば保存されません。それを無視するサービスでも削除要求や「今後一切アーカイブしないでくれ」と行った要求が通るのでちょっと面倒なだけでした。今回なぜarchive.isを知ってブロックする事になったかと言うと・・別件で過去3年分のサーバーアクセスログからリンク元一覧を作成していたら「archive.is」からのリンクを発見。なにかなー？とリンク元をゲットしてみると、対象URLのデータ丸ごとアーカイブされていました。コードを見てみると、GoogleAnalytics関連は無効化されているので余計なログは残らないしGoogleのポリシーにも違反しないのは良いところだけれど・・・元ページなんかを示すcanonicalタグは書き換えられていました。まあどのサイトをキャッシュし

はてなブックマーク

タグ

2017年1月6日のブックマーク (1件)

アーカイブ拒否を無視するarchive.isをブロックする – REIMA's Blog

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス