2017年1月6日のブックマーク (1件)

  • アーカイブ拒否を無視するarchive.isをブロックする – REIMA's Blog

    Webサイトを保存するオンラインサービスは幾つもありますが、大抵はrobotsへnoarchive属性を付けておけば保存されません。 それを無視するサービスでも削除要求や「今後一切アーカイブしないでくれ」と行った要求が通るのでちょっと面倒なだけでした。 今回なぜarchive.isを知ってブロックする事になったかと言うと・・ 別件で過去3年分のサーバーアクセスログからリンク元一覧を作成していたら「archive.is」からのリンクを発見。 なにかなー?とリンク元をゲットしてみると、対象URLのデータ丸ごとアーカイブされていました。 コードを見てみると、GoogleAnalytics関連は無効化されているので余計なログは残らないしGoogleのポリシーにも違反しないのは良いところだけれど・・・ 元ページなんかを示すcanonicalタグは書き換えられていました。 まあどのサイトをキャッシュし

    アーカイブ拒否を無視するarchive.isをブロックする – REIMA's Blog
    suthio
    suthio 2017/01/06
    “ほんと他人のサイトのコンテンツを無許可で自分の良いように扱うサイトは潰れてしまえばいい。 ”