郵便番号と住所の変換システムを扱うエンジニアの間で悪名高かったKEN_ALL.CSVだが、2023年6月更新分より、文字コードがUTF-8に、フリガナが全角カタカナになり、町域名が長いときも複数レコードに分割されなくなったファイルが新たに追加された模様。従来通りの書式のファイルもダウンロードできる。今後は町域名に含まれている自然言語の注釈(「その他」「※番地」「以下に記載のない場合」など)をフラグに変換する予定もあるようだ(郵便番号データダウンロード)。
こんにちは、羽山です。 今回は先日開催した弊社主催の技術イベント「Raccoon Tech Connect #1 レガシーシステムに立ち向かう技術」で登壇した内容を当ブログで公開します。 イベントのテーマは「レガシーシステムに立ち向かう」ということで、システムを長らく運用していくと自然と溜まっていく 技術的負債 との付き合い方に着目しました。 技術的負債に対する理解を深め、技術的負債を可視化することによって自然と対処される状態を作る方法を解説します。 アーカイブ映像(YouTube) スライド(Speaker Deck) 戦略シミュレーションゲームで例える 今回の主題は「技術的負債」ですが、最初はたとえ話から始めます。 みなさんは戦略シミュレーションゲームをプレイした経験がありますか? 次のスライドは戦略シミュレーションゲームによくありがちなユニット生産画面を表しています。 そして、多くの
「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。 【この記事に関する別の画像を見る】 「KEN_ALL.CSV」として知られる日本郵便の郵便番号データが、2023年6月の更新から改善されたそうで、界隈が歓喜の声に包まれています。 新しいデータファイル「utf_all.csv」の改善ポイントは、以下の通り。 ・文字コードが「Shift_JIS」から「UTF-8」に ・読み仮名データが半角カタカナから全角カタカナに ・複数レコードへの分割は廃止。従来は全角町域名の文字数が38文字を超える場合、半角カタカナ町域名のフリガナが76文字を超える場合に複数のレコードに分割されていた 「ぇ、古いのはどうしたの? システム更新しなきゃいけないの?」と思った方はご安心を。従来形式のデータも引き続き利用可能です。 「utf_all.csv」に都道府県別のデータはなく、ファイルサ
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く