タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

薀蓄に関するtaka84u16のブックマーク (1)

  • 現在の郵便番号データの事 - at_yasuの日記

    郵便番号をDBに突っ込みまして、その際に落ちた所とはまったところ、んで出来たデータの事。 落とし穴 データは全てSJIS データにある住所の読み仮名は全て半角カタカナ。nkf通すのが煩わしくて今回無視。 readmeには、書いていない事 「町域」フィールドが複数行にまたいでいる 「"以下に掲載がない場合"」「"次に番地がくる場合"」「"(または町・村)一円"」という文字列が入ってるけど、これらは基的には住所じゃないので不要 大文字の括弧「(」と小文字の括弧「(」がごちゃ混ぜらしい。未確認だけど・・・ 現在のデータ状態(2009/01/14) 以下の数字はDBに突っ込んだ数字でありまして、CSVのレコード件数ではないです。*1 データ総数:122254件 郵便番号の件数:118618件 郵便番号重複(同県内住所違い)件数:19799件*2 郵便番号重複(他県住所違い)件数:6件 498-0

    現在の郵便番号データの事 - at_yasuの日記
  • 1