郵便番号と住所の変換システムを扱うエンジニアの間で悪名高かったKEN_ALL.CSVだが、2023年6月更新分より、文字コードがUTF-8に、フリガナが全角カタカナになり、町域名が長いときも複数レコードに分割されなくなったファイルが新たに追加された模様。従来通りの書式のファイルもダウンロードできる。今後は町域名に含まれている自然言語の注釈(「その他」「※番地」「以下に記載のない場合」など)をフラグに変換する予定もあるようだ(郵便番号データダウンロード)。
はじめに 郵便番号と住所の割当についての注意点 郵便番号データのカラム定義 複数行に分割されるレコード 町域名の編集 "以下に掲載がない場合" "・・の次に番地がくる場合" "・・一円" カンマ区切りされた町域名 地割 町域名がカッコ付きで補足されるパターン (全域),(丁目)(各町)(番地)(無番地)(その他) (○○屋敷) ビルの記載 (地階・階層不明)(X階) ・・を除く) ・・を含む) ・・その他) ・・以下) ・・以上) ・・以内) ・・以降) ・・以外) ・・」以外 ・・番地以上 カッコの取り扱い JPostal はじめに 郵便番号の入力に応じて、都道府県や市区町村を入力補完したい、というユースケースは良くあります。 日本郵便の公開する郵便番号データ ken_all.csv は、このようなユースケースのための辞書データ候補に挙げることができます。 しかし郵便番号データ ken_
この記事は Vim Advent Calendar 2020 25日目の記事です。 はじめに 年末ですね。年賀状ですね。インターネットが普及した現代、若い世代の人達においては年賀状を交わす事は少なくなってしまったかもしれません。しかし田舎育ちの僕やある程度年配の方々の世界線では年賀状は未だ変わらず有効なコミュニケーション手段として採用されており「アイツん家の子、大きくなったな」「アイツ随分老けたな」といった思い出回帰の方法としても使われています。 さて皆さんは年賀状をどの様に作っておられますか?手書きですか?それとも「筆○2020」等といった年賀状作成専用ソフトをお使いだったりしますか?僕は毎年 LibreOffice の宛名書き印刷を使っています。 LibreOfficeで宛名印刷(縦書き/連名): ひろろろぐ LibreOffice で差し込み印刷する記事は沢山あるのですが、連名がちゃ
「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。 【この記事に関する別の画像を見る】 「KEN_ALL.CSV」として知られる日本郵便の郵便番号データが、2023年6月の更新から改善されたそうで、界隈が歓喜の声に包まれています。 新しいデータファイル「utf_all.csv」の改善ポイントは、以下の通り。 ・文字コードが「Shift_JIS」から「UTF-8」に ・読み仮名データが半角カタカナから全角カタカナに ・複数レコードへの分割は廃止。従来は全角町域名の文字数が38文字を超える場合、半角カタカナ町域名のフリガナが76文字を超える場合に複数のレコードに分割されていた 「ぇ、古いのはどうしたの? システム更新しなきゃいけないの?」と思った方はご安心を。従来形式のデータも引き続き利用可能です。 「utf_all.csv」に都道府県別のデータはなく、ファイルサ
Twitter で以下のツイートを見かけました。 まじか。あの郵便番号データ「KEN_ALL.CSV」がバージョンアップして、人の形をしたデータになってる。今後も改善予定のようで楽しみ。 ・町域名が長い場合に複数レコードに分割するのをやめた ・半角カナをやめた ・UTF-8形式に変更 🔗郵便番号データダウンロード|日本郵便https://t.co/OgElcsc5Xc pic.twitter.com/a9AjUdAwSJ — にゃんこそば🌤データ可視化 (@ShinagawaJP) June 30, 2023 マジか! ということで早速日本郵政のサイトを確認してみました。 郵便番号データダウンロード 従来の「住所の郵便番号(CSV形式)」に加えて「住所の郵便番号(1レコード1行、UTF-8形式)(CSV形式)」が掲載されていますね。 郵便番号のデータ利活用の観点から2023年6月更新よ
2023/07 追記 長年、改善の雰囲気すらなかったKEN_ALLですが、国会で住所の正規化が話題になった為か、ついに新フォーマットが登場しました! https://forest.watch.impress.co.jp/docs/serial/yajiuma/1514142.html 本記事は旧フォーマットでの話となりますのでご了承ください。 こんにちは。Japan Digital Design のインフラチームに所属している渡邉です。 有志で AdventCalendar をやっており、今回は18日目の記事です。 https://adventar.org/calendars/5160 もう長いことこの業界で働いており、20代のころの仕事はほとんど思い出せないくらい、技術の移り変わりや進歩の速さに追いつけず勉強の日々ですが、昔と変わらぬ懐かしい佇まいで存在し続けるものも中にはあります。それ
機能 KEN_ALL.CSV(日本郵便で公開されている、郵便番号データ)を元に、町域名(半角カタカナ/漢字)部分をスッキリさせる(複数行にわたる括弧部分を削除とか、"以下を除く"等を削除) 変換後のファイルを出力する(必要な列のみ出力するようにすることも簡単な修正で可能) 実行環境 -Windows10 -EmEditor Professional (64-bit) Version 19.8.5 にて確認 使い方 日本郵便の郵便番号データダウンロードページで公開されている郵便番号データ(全国一括)を取得し、"KEN_ALL.CSV"ファイルを準備する(*1) EmEditorで"KEN_ALL.CSV"ファイルを開き、下記マクロを実行する。 KEN_ALL.CSVと同じディレクトリにKEN_ALL_cnv.txtファイルが作成される (KEN_ALL_LOG.txtファイルも出力される)
ケンオール開発チームです。 今回は、ケンオールグッズの紹介と、Swiftクライアントの紹介、そしてケンオールが取り扱う「郵便番号」とは何か、を紹介します。 前号はこちらです。 ケンオールグッズ エコシステムツール紹介 郵便番号データの処理が難しい理由 ケンオールについて ケンオールグッズ すでにTwitterなどでご存じの方もいらっしゃるとは思いますが、ケンオールグッズが完成しました!以下のサイトで購入できます。 https://suzuri.jp/kenall このグッズはケンオールファンの皆様のために作ったものなので、実費のみをいただいて提供しております。弊社の利益は一切発生しません。(将来的に変更する可能性はあります) エコシステムツール紹介 今回は、 @woxtuさんが開発した、Swiftクライアントを紹介します。 https://github.com/woxtu/swift-ke
はじめに 郵便番号データ改定の経緯 町域名の問題点 郵便番号データの泥臭い編集 まとめ はじめに 2023年6月より、日本郵政の公開する郵便番号データ、通称 ken_all.csv の改定版が公開されました。 旧来の ken_all.csv に加えて、「住所の郵便番号(1レコード1行、UTF-8形式)(CSV形式)」 utf_all.csv が追加されています。 郵便番号のデータ利活用の観点から2023年6月更新より新たな形式でのデータを追加で公表します。 読み仮名データは全角カタカナとなっています。 従前公表のデータについては、全角となっている町域名の文字数が38文字を超える場合、また、半角カタカナとなっている町域名のフリガナが76文字を超える場合には、複数レコードに分割していましたが、今回追加公表するデータについては、1郵便番号データに対し、1行で記載しています。 UTF-8形式で記載
郵便番号を入力して住所変換 Webサイトで住所を入力する際に郵便番号を検索して住所に変換する機能が実装されていることがよくあります。 例えば「1710021」を入力すると「東京都豊島区西池袋」が表示されます。 郵便番号だけで住所の大半が自動入力されるので、現在の住所の入力フォームには実装が必須になっています。 郵便局のutf_ken_all.csvのデータで住所変換 utf_ken_all.csvとは日本郵便が提供する全国の郵便番号データが格納されたCSVファイルです。 このファイルには、全国の都道府県・市区町村・町域レベルの郵便番号情報が含まれています。 utf_ken_all.csvをダウンロードするには郵便番号データダウンロードのWebページにアクセスして、「最新データのダウンロード」のリンクをクリックするか、以下のURLにアクセスすればダウンロードできます。 https://www
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く