不動産の分析に取り掛かる際、重要な前処理の一つがgeocodingと呼ばれる住所データの緯度経度変換です。 文字列情報である住所を数値情報である緯度経度に変換することで、分析を行いやすくすることができます。 このgeocodingを数十万件単位で行いたい場合、問題となってくるのが実行時間です。 多くの場合、HTTPでgeocoding APIを叩いて結果を取得することになるため、1件1秒としても50万件では6日近くの時間がかかってしまいます。 そこで今回はローカルで大量のgeocodingが可能なpydamsというライブラリをご紹介します。 pydamsとは pydamsとは、dams(Distributed Address Matching System)というアドレスマッチングライブラリのpythonラッパーです。 github.com まずdamsの方から紹介します。 damsは東京