ブックマーク / blog.kenall.jp (12)

  • 日本の祝日データの更新とファイル名の話 - ケンオールブログ

    の祝日API2023年版に更新しました。 内閣府は毎年国民の祝日についてのCSVデータを公開しています。 このデータを使いたい人は年に1回ダウンロードすればいいだけなのですが、今回は少し事情が違います。 ファイル名が違う 昨年までのCSVファイルは以下のURLからダウンロードできました。 https://www8.cao.go.jp/chosei/shukujitsu/syukujitsu.csv 今年は以下のURLからダウンロードできます。 https://www8.cao.go.jp/chosei/shukujitsu/shukujitsu.csv ファイル名の二文字目がyからhに変わっています。 (2023/02/03 追記) 内閣府のページが更新され、元のファイル名syukujitsu.csvが使えるようになりました…が、なんと新しい方のファイルshukujitsu.csv

    日本の祝日データの更新とファイル名の話 - ケンオールブログ
    t_f_m
    t_f_m 2023/02/01
    "ファイル名の二文字目がyからhに変わっています" / syukujitsu と shukujitsu
  • ケンオール通信第12号:括弧つきの町域(2) 丁目や番地の処理 - ケンオールブログ

    ケンオール通信第11号:括弧つきの町域(1) 括弧の内側と外側の分割では、括弧を含む町域を持つ郵便番号レコードの処理の前半部分として、主に括弧外の住所処理について紹介しました。 今回は、括弧内の住所処理を紹介します。 データは、記載がない限り2021-11-30のデータを用いています。 前回までと元データのバージョンが違いますのでご注意ください。 処理結果を確認してみたい方はこちらのデモから試してみてください。 括弧内の住所処理の基方針 丁目の処理 範囲指定 「丁目」と同列の住所単位(1) 「地割」 「丁目」と同列の住所単位(2) 丁 番地や数字情報の処理 番地 区 (北海道の住所単位) 数字が併記されている場合 丁目の併記 番地の併記 「丁」の単位と大阪府堺市 次回予告 ケンオールについて 括弧内の住所処理の基方針 ケンオールでは原則として「住所補完に役立つ情報を可能な限り保持する」

    ケンオール通信第12号:括弧つきの町域(2) 丁目や番地の処理 - ケンオールブログ
    t_f_m
    t_f_m 2021/12/13
  • ケンオール通信第11号:括弧つきの町域(1) 括弧の内側と外側の分割 - ケンオールブログ

    今回は、郵便番号データ内の括弧と括弧外の分割について紹介します。 データは、記載がない限り2021-05-31のデータを用いています。 ケンオールでどのようにパースされているかは、こちらのデモから試してみてください。 括弧つきの町域のパターン 町名 + 括弧(丁目、小字、番地など) 町名 + ビル名 + 括弧(階層) 町名 + 番地 + 括弧 町名、町名 + 括弧 町名 + 地割 + 括弧 ケンオールについて 括弧つきの町域のパターン 郵便番号データの町域には、括弧つきのものが多数存在します。 0600042: 北海道 札幌市中央区 大通西(1~19丁目) こうしたレコードは10,592件あります。 この大通西(1~19丁目)が町域にあたりますが、この構造は以下の5パターンに分かれます。 町名 + 括弧(丁目、小字、番地など) 町名 + ビル名 + 括弧(階層) 町名 + 番地 + 括弧

    ケンオール通信第11号:括弧つきの町域(1) 括弧の内側と外側の分割 - ケンオールブログ
    t_f_m
    t_f_m 2021/12/13
  • ケンオール通信第10号: 町名を空にしなければいけない町域 - ケンオールブログ

    今回は、郵便番号データ内の町名を空にしなければいけない町域について紹介します。 データは、記載がない限り2021-05-31のデータを用いています。 ケンオールでどのようにパースされているかは、こちらのデモで試せます。 以下に掲載がない場合 ○○一円 ○○の次に番地がくる場合(○○は町名) ○○の次に番地がくる場合の歴史的背景 参考文献 ケンオールについて 更新履歴 町域に文字列が記載されているものの、コメントと同様の文字列のため削除しなければいけないパターンが存在します。 そのパターンは以下の通りです。 以下に掲載がない場合 ○○一円(○○は町名) ○○の次に番地がくる場合(○○は町名) 以下に掲載がない場合 以下に掲載がない場合とは、以降のレコードに掲載されていない住所の場合はこの郵便番号を使うよう指示しているコメント文字列です。 0600000: 北海道 札幌市 中央区 以下に掲載が

    ケンオール通信第10号: 町名を空にしなければいけない町域 - ケンオールブログ
    t_f_m
    t_f_m 2021/12/01
    "このようなレコードは17件存在します。 結論からいうと除去すれば問題ありませんが、このレコードの歴史的背景が面白いので紹介します"
  • ケンオール法人番号APIをリリースしました - ケンオールブログ

    国税庁が公開する法人番号データをAPIで提供するサービス「ケンオール法人番号API」をリリースしました。 法人名を検索できるAPIデモはこちら 法人番号データとは? 法人番号とは、国税庁によって全ての法人(国内・国外合わせて500万件以上)に付与された13桁*1の固有番号です。個人に付与されるマイナンバーと異なり、法人番号のマスターデータは公開されています。 国税庁は、この法人番号とそれに付随する以下の情報を合わせた基3情報を、オープンデータとして公開しています。 - 商号または名称 - 店または主たる事務所の所在地 ケンオール法人番号APIとは? 法人番号データを使うことで、法人の正式な住所情報を簡単に取得できます。 ケンオール法人番号APIは、この法人番号データをAPIとして提供するサービスです。 ケンオール法人番号APIを使うことにより、例えば以下のようなシステムを簡単に作ること

    ケンオール法人番号APIをリリースしました - ケンオールブログ
    t_f_m
    t_f_m 2021/09/22
  • リリース半年の振り返り - ケンオールブログ

    ケンオールを今年の2月8日にリリースしてから半年が経ちました! ご利用いただいている皆様、応援してくださっている皆様、当にありがとうございます。 郵便番号検索APIサービスとして始まったケンオールも、この半年で新しい機能・サービスが少しづつ追加されてきました。 どのような変更があったのかを紹介していきます。 新しいAPI 市区町村API 郵便番号逆引き検索API(ベータ) 自己IPアドレス確認API (NEW!) 郵便番号ダウンロードAPI (NEW!) 法人番号API(ベータ) 新しいサービス エンタープライズプラン 請求書払い対応 今後について ケンオールについて 新しいAPI 市区町村API 4月には、都道府県以下の市区町村を取得する、市区町村APIの提供を開始しました。 都道府県コードを入力すると、その都道府県以下の市区町村の一覧を取得できます。 curl -s -H "Auth

    リリース半年の振り返り - ケンオールブログ
    t_f_m
    t_f_m 2021/08/15
  • ケンオール通信第8号: ビル名の処理 - ケンオールブログ

    今回は、郵便番号データ内のビル名の処理について紹介します。 データは、記載がない限り2021-05-31のデータを用いています。 ケンオールでどのように郵便番号を処理しているかは、こちらのデモから確認してみてください。 前回はこちらです。 PyData Osaka Meetupの発表スライドと動画はこちらです。 ビル郵便番号 町名とビル名を分割する 階層と郵便番号 ケンオールについて ビル郵便番号 郵便番号データの大半は、ある郵便区画に対して番号を割り当てたレコードとなっていますが、実は一部の高層ビルには階層ごとに郵便番号が割り振られています。 ここでは、このような郵便番号をビル郵便番号と呼びます。 1066101: 東京都港区六木六木ヒルズ森タワー(1階) なお、このビル郵便番号は、個別事業所番号とは別のものであることに注意してください。 このようなビルは、郵便番号データ内には84棟

    ケンオール通信第8号: ビル名の処理 - ケンオールブログ
    t_f_m
    t_f_m 2021/07/12
    偶然なのか、少なくとも例示されたやつに限っては、郵便番号末尾の数値見たらどの階宛てなのかわかるのがおもしろい。他のビルでもそうなんだろうか。
  • ケンオール通信第7号: 日本の住所の構造と郵便番号データ - ケンオールブログ

    ケンオール通信第4号では、郵便番号データの処理方法の最初の一歩として、複数行の結合について紹介しました。データ処理の続きを説明する前に、まず日の住所とはどういう構造になっているかを紹介します。 日の住所の構造 郵便番号データの住所構造 京都の通り名 地割 特定の番地に割り当てられた郵便番号 ビルに割り当てられた郵便番号 PyData.Osaka に登壇します ケンオールについて 編集履歴 日の住所の構造 日の住所は、領域の大きい地域名から小さい地域に向かって書いていくという構造です。この大から小という構造は、日の他に中国韓国台湾などが用いており、東アジア諸国では一般的な記法ですが、世界的には小さい領域から大きい領域に向かって書いていくという記法が一般的です。 余談ですが、東アジア以外の全ての国が小から大という表記ではなく、ハンガリーなど一部の国で大から小という表記形式を採用し

    ケンオール通信第7号: 日本の住所の構造と郵便番号データ - ケンオールブログ
    t_f_m
    t_f_m 2021/06/28
  • ケンオール郵便番号逆引き検索機能のベータリリース - ケンオールブログ

    2022/02/21 郵便番号逆引き検索APIを正式リリースいたしました! ケンオールに、住所から郵便番号を検索できる、郵便番号逆引き検索機能が追加されました。 (このデモはこちらでお試しいただけます。) 例えば、京都市上長者町通堀川東入一町目という住所を検索してみます。この住所クエリは、上京区という文字が抜けている、不完全な住所になっています。 http://api-beta.kenall.jp/v1/postalcode/?q=city:京都市+AND+kyoto_street:上長者町通堀川東入+AND+town:一町目 上記のような部分検索であっても正しい郵便番号を検索できます。 { ... "postal_code": "6028064", ... "prefecture": "京都府", "city": "京都市上京区", "town": "一町目", "koaza": "",

    ケンオール郵便番号逆引き検索機能のベータリリース - ケンオールブログ
    t_f_m
    t_f_m 2021/05/31
  • ケンオール通信第4号 - ケンオールブログ

    ケンオール開発チームです。 今回は、郵便番号データの更新、新機能の市区町村API郵便番号10桁化対応、郵便番号データの複数レコード結合処理を紹介します。 前号はこちらです。 郵便番号データの更新 新機能: 市区町村API 郵便番号データ処理の秘密(1)複数行のレコードの結合処理 新機能?? 郵便番号10桁化対応 ケンオールについて 郵便番号データの更新 2021/03/31(水)に、日郵政様の郵便番号データの更新に伴い、ケンオールのデータも更新しました。 新機能: 市区町村API 都道府県以下の市区町村を取得するAPIの提供を開始しました。 このAPIの利用には、総務省の提供する全国地方公共団体コードが必要になります。 全国地方公共団体コードは、都道府県コード2桁、市区町村コード3桁で構成されている、日の地方公共団体に付与されたコードです。総務省の提供するデータでは、最後にチェックデ

    ケンオール通信第4号 - ケンオールブログ
    t_f_m
    t_f_m 2021/04/01
    普通のネタと四月馬鹿を同じ記事に書くの紛らわしいよ!
  • ケンオール通信第2号 - ケンオールブログ

    ケンオール開発チームです。 今回は、郵便番号データ・パーサの更新、ケンオール公式JavaScriptクライアントライブラリ、新しいエコシステムツールのご紹介、APIプレビュー機能、Pythonパッケージングについての講演、障害情報の紹介をします。 前号はこちらです。 郵便番号データ・パーサの更新 ケンオール公式JavaScriptクライアントライブラリ エコシステムツール紹介 Slackアプリ kenall-for-slack Rust製CLIツール kenall-rs PHPクライアントライブラリ kenall.php APIプレビュー機能 住所対応のアップデート 0993211 北海道網走郡大空町東藻琴(北1区)(更新) 9398052 富山県 富山市 大泉1区南部 9480012 新潟県十日町市新座(第1、2)(更新) Python Charity Talks in Japan 20

    ケンオール通信第2号 - ケンオールブログ
    t_f_m
    t_f_m 2021/03/15
  • ケンオール通信第1号 - ケンオールブログ

    2/8にケンオールをリリースしてから一週間が過ぎました。たくさんの方のご登録、ありがとうございます! 我々の想像を遥かに超えた反響の大きさに驚いています。 中には、早くもケンオールを活用するためのツールを開発してくれた方もいらっしゃいました。 @osamingo さんによるケンオールのGoクライアントライブラリ https://github.com/osamingo/go-kenall @heavenshell さんによる Vimプラグイン(開発中、デモ動画のみ) https://twitter.com/heavenshell/status/1359112937500155905 次に、いただいたコメントから、いくつかピックアップして解説したいと思います。 ケンオールという名前がいい! 対応していない住所がある 7660001 香川県仲多度郡琴平町琴平町(427番地以上、川西) 48508

    ケンオール通信第1号 - ケンオールブログ
    t_f_m
    t_f_m 2021/02/15
    住所システムもこういうの見ると改修必要なんだなと思う
  • 1