この前書いたAmazonの商品個別ページのURLからASINを取得するというエントリに載せた、ウノウのアレを移植した関数で色々試してみてたところ、なんか思ったよりもASINを抽出出来る割合が少ないというか取りこぼしが多いんじゃないかという気がしたため、真面目に自力で作ってみました。(正直汚ねぇコードだなーとも思ってたし。) 処理内容は、amazonのurlかチェックして、もしそうならasinを含むかどうかチェックするという感じです。 def get_asin_from_url(url): '''urlからasinを抽出''' url = url.lower() amazon_r = re.compile(r'^https?://(?:[^.]+\.)?(?:images-)?amazon\.(?:com|ca|co\.uk|de|co\.jp|jp|fr|cn)(/.+)$') amazo