![プログラマーを苦しめてきた郵便番号データ「KEN_ALL.CSV」が改善! 扱いやすい新形式/従来形式のデータも引き続き利用できるから安心してネ【やじうまの杜】](https://cdn-ak-scissors.b.st-hatena.com/image/square/99d3b79805c6e6804ff88ce53b3de1ad91bc825c/height=288;version=1;width=512/https%3A%2F%2Fforest.watch.impress.co.jp%2Fimg%2Fwf%2Flist%2F1514%2F142%2Fimage-top.png)
はじめに 郵便番号と住所の割当についての注意点 郵便番号データのカラム定義 複数行に分割されるレコード 町域名の編集 "以下に掲載がない場合" "・・の次に番地がくる場合" "・・一円" カンマ区切りされた町域名 地割 町域名がカッコ付きで補足されるパターン (全域),(丁目)(各町)(番地)(無番地)(その他) (○○屋敷) ビルの記載 (地階・階層不明)(X階) ・・を除く) ・・を含む) ・・その他) ・・以下) ・・以上) ・・以内) ・・以降) ・・以外) ・・」以外 ・・番地以上 カッコの取り扱い JPostal はじめに 郵便番号の入力に応じて、都道府県や市区町村を入力補完したい、というユースケースは良くあります。 日本郵便の公開する郵便番号データ ken_all.csv は、このようなユースケースのための辞書データ候補に挙げることができます。 しかし郵便番号データ ken_
KEN_ALL.csv はだめだとよく言われます。では何がだめなのでしょうか。 Blogや Twitterなどでよく語られているので、その内容を紹介してみたいと思います。 Blog 「ぐるぐる〜 」 まず、かなり網羅的にまとまっていたのが、下記の ブログ「ぐるぐる〜 」のエントリです。 bleis-tift.hatenablog.com 項目としては、下記のようなものが上げられています。あるあるですね… 単一レコードの複数行分割 「以下に記載がない場合」、「次のビルを除く」を含むレコード 「〜」で範囲を示すレコード 「〜」や「以上」、「以下」を含むレコード 「以外」「を除く」を含むレコード 「その他」を含むレコード 「全域」を含むレコード 「(丁目)」、「(郡)」、「(番地)」などを含むレコード 「を含む」を含むレコード 「地階・階層不明」を含むレコード 複雑な、としか言い表せないレコード
各種郵便番号データのダウンロードはこちらからどうぞ。 住所の郵便番号(CSV形式) 読み仮名データは半角カタカナになっています。 読み仮名データの促音・拗音を小書きで表記しないもの例:ホツカイドウ 読み仮名データの促音・拗音を小書きで表記するもの例:ホッカイドウ 住所の郵便番号(ローマ字)(CSV形式) 読み仮名データはローマ字になっています。 住所の郵便番号(ローマ字)例:HOKKAIDO 住所の郵便番号(1レコード1行、UTF-8形式)(CSV形式) 郵便番号のデータ利活用の観点から2023年6月更新より新たな形式でのデータを追加で公表します。 住所の郵便番号(1レコード1行、UTF-8形式) 事業所の個別郵便番号(CSV形式) 事業所の個別郵便番号 郵便番号簿PDF(2023年度版) 郵便番号簿PDF(2023年度版) 郵便番号変更案内(2024年2月29日更新) 2023年度版郵便
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く