image-extratorはURL中にあるメインとおぼしき画像を取得するソフトウェアです。 Webサイトのサムネイルサービスでよくあるのはスクリーンショットを撮ってサムネイル画像を返却するサービスです。しかしこれでは雰囲気は分かっても同じドメインだとどれも似たような画像になってインパクトに欠けます。そこで使ってみたいのがメインの画像を返してくれるimage-extratorです。 一例です。 例えばYahoo! Japanのトップページです。この場合、 この画像が選択されました。 こちらの記事の場合は… こちらの画像です。 image-extratorはRedditのシステムで使われているスクレイピングコードをベースに作られています。システムはGoogle App Engineを使っており、URLを投げるとその画像のパスが返ってくる仕組みです。 image-extratorはPython