こちらの記事をご覧いただきありがとうございます。 以前にSUUMOの物件データをスクレイピングした記事と、スクレイピングデータを前処理した記事を投稿しました。そこからさらに前処理案を思いついて実践しましたので、解説します。 ↓が、私が以前投稿したSUUMOの物件データをスクレイピングした記事と、スクレイピングしたデータを前処理した記事です。よろしければ先にそちらをご覧ください。 注意書き スクレイピングしたデータを公開するといろいろ問題になってしまうので、実際にデータを処理してこれがこうなったとお見せすることができません。実データではないサンプルを使ってどのような処理を行ったのかをお伝えしますが、実データの処理とはまた違うことをご了承ください。 行った処理 間取りを部屋数+(S,L,D,K) があるかどうかに変換 住所から緯度経度を追加 緯度経度を使い、「最寄駅からの距離」「皇居からの距離