こちらの記事「日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。」を読み、実案件で住所を扱うシステムの構築・運用や住所を含むデータ分析など行っていた頃の思い出と重なり、もらい鼻血を出しそうになったので記事にしました。 色々書いていますが、要は特殊な地名に起因する辛さ以外にもこんなに大変なことがあるということです。 大変なので次の2点をまずは検討すると幸せになれるかもしれません、という記事です。 緯度経度への変換が必要ならまずはGoogleかYahooのAPIを検討 大量に処理する必要があるなら都道府県や市区町村などの粒度でサマライズし、個別の地点取得はなるべく避ける 前出の記事は住所コードへの突合を目的としている様子なので、私が経験したことのある案件、例えば会員ページで住所情報の入力を受けてDBへ格納するとか、データ分析案件で顧客データの住所フィールドで色々やるとかという場合