pythonでWEBサイト内のリンクを収集するクローラーを作っていて、その時に、相対パスや絶対パスがあるので、統一しないと色々と面倒になる。そこで、、関数を作ろうかなと思っていたんだけど、lxmlモジュールで簡単にできることが分かった。 ということで、WEBサイト内のパスを相対パス⇒絶対パスに変更する方法。 import urllib2 import lxml.html html = urllib2.urlopen("http://www/autoproject.nagoya/index.php").read() dom = lxml.html.fromstring(html) dom.make_links_absolute("http://www/autoproject.nagoya") urlList = dom.xpath("//@href") このlxmlモジュールやxpathの使