wget -rで再帰的にクロールできるのはみんな知っていると思うけども、同一サーバ内にクロールの必要ない対象があるので特定パス以下だけをクロールしようと思って-npをつけた。 -np, --no-parent 親ディレクトリを取得対象にしないそしたら、CSSが別途/style/common.cssとかにあったのでレイアウトが崩れてしまった!それをどうやって解決したかというのが今回の日記のお話。 単純にwget http://example.com/style/common.css とかやるとカレントディレクトリにcommon.cssを作ってしまう。そこでまずは-x -x, --force-directories ディレクトリを強制的に作る次に、-rでクロールした側が元から相対パスになっててくれたら必要ないんだけど、今回の場合src="/style/common.css"とかになっていたので