タグ

住所に関するgayouのブックマーク (9)

  • 日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita

    先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 さて、このジオコーダーは、住所を正規化してそれを「大字町丁目コード」という12桁の数字に変換し、そのコードをファイル名として GitHub ページ上に大量においた JSON ファイルにアクセスして緯度経度を取得するということをやっています。 つまり、住所の正規化からコードに変換する部分がとても重要で、そもそも正規化に失敗してしまうとどうしようもないという仕様なんです。 さいわい先日経産省が公開した IMI コンポーネントツール である程度のことをやってくれるのですが(というかそうであることを期待したのですが)、いろいろ調べ始めると住所という仕組みはほんとに複雑で、Facebook で絡んでくださった @hfu さんいわくまさに「自然言語処理そのもの」であ

    日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita
    gayou
    gayou 2023/05/04
    ブログ記事から住所を抽出するタスクをやってるけど、表記揺れの対応に苦慮しているので参考にする。
  • TechCrunch | Startup and Technology News

    Line Man Wongnai, an on-demand food delivery service in Thailand, is considering an initial public offering on a Thai exchange or the U.S. in 2025.

    TechCrunch | Startup and Technology News
    gayou
    gayou 2020/08/06
  • 住所分割&誤住所発見ツールを作ってわかったこと - Qiita

    #ダイレクトメールはけっこう返送されてくる 最近、「早く言ってよ~」の影響から名刺のデータ化が推進されているのはいいとして、課題はそのスキャンの誤認識による修正ですよね。 一般的な解決手段としては… ※あ、長くなりますよ、暇な時間のある方限定でお進みください。 1.オペレータによる修正を契約してデータ修正を依頼する 2.データ登録前に複数社員による目視確認を行う 3.データ登録時に社員による目視確認を行う 4.特に確認せずそのまま登録する …のどれかになるのかと思いますが1.は件数が多いとそこそこ高くつくので利用している会社はそれほど多くないと思いますがどうなんでしょうね。 2.~4.は意外と抜けることが多いです。 例えば、以下は実際にスキャナからの読み取りで誤認識された住所です。 福岡県久留米市三潴町高三瀦 福岡県久留米市三潴町高三潴 大阪府枚方市招堤田近 大阪府枚方市招提田近 愛知県名

    住所分割&誤住所発見ツールを作ってわかったこと - Qiita
    gayou
    gayou 2019/03/18
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 台湾 郵便番号

    配送精度を向上させるために、2020年3月に台湾郵便番号が3桁+ 3桁の形式で6桁にアップグレードされます。このウェブサイトには75,521の台湾 郵便番号郵便番号があって、市, エリア, Scope, 郵便番号, 道路などが含まれて、またオンライン地図が付属しています。

  • 【Ruby】住所を検出・分割するAPIが欲しいので作ってみた - Qiita

    概要 住所絡みのAPIにおいて、「住所から緯度・経度を割り出すAPI」とか「郵便番号から住所を割り出すAPI」とかはよくありますが、「文字列から住所を切り出すAPI」は案外ないものですね……。 例えば「住所:〒105-0011 東京都港区芝公園4丁目2-8東京タワー大展望台2F TEL:03-3433-5111」を「["東京都","港区","芝公園","4-2-8","東京タワー特別展望台2階"]」と変換するぐらいパワフルな住所APIが欲しかったので、Rubyで実際に作成してみました。 ※免責事項:以下のコードは、あらゆる住所を正確に検出・分割できることを保証しません。 ※完成品だけ欲しい場合はここに置いておきます(MITライセンスとします)。 住所分割用ライブラリ Step0:必要なデータを用意する 住所を検出する際、一番頼りになるのは公式が出す郵便番号データです。 郵便番号データダウン

    【Ruby】住所を検出・分割するAPIが欲しいので作ってみた - Qiita
    gayou
    gayou 2018/12/23
  • 住所が含まれた連想配列から緯度経度を取得して、多次元連想配列を生成する - Qiita

    $array = array( '新国立美術館' => '東京都港区六木7-22-2', '代々木駅' => '東京都渋谷区千駄ヶ谷5丁目24', '千駄ヶ谷駅' => '東京都渋谷区千駄ヶ谷1丁目35', '東京スカイツリー' => '東京都墨田区押上1丁目1-2', ); この連想配列から住所データを取得。地理情報APIを叩き、緯度経度を取得。 最終的に、施設名・住所・緯度・経度がそれぞれまとまった多次元連想配列として $addressDataを生成したい。 多次元連想配列は以下のようにしたい。 Array ( [0] => Array ( [0] => Array ( [name] => 新国立美術館 ) [1] => Array ( [address] => 東京都港区六木7-22-2 ) [2] => Array ( [latitude] => 35.66518532 ) [

    住所が含まれた連想配列から緯度経度を取得して、多次元連想配列を生成する - Qiita
  • 緯度経度付き住所LODを作りました - Qiita

    Linked Open Addresses Japan サイトのURLは以下のになります。 使い方 住所データの引き方は2種類あります。URLに直接入力する方法と、トップページからブラウジングする方法です。 URLに直接入力 Firefox、Chrome等WebブラウザのURL入力フォームに住所を直接入力することで、該当住所のデータが閲覧できます。 入力は以下のようにしてください。 http://uedayou.net/loa/[都道府県][市区町村][町・大字][丁目・字][番地] 「一丁目」等の丁目の数は漢数字で記述してください。 番地は半角数字で記述して「1番」、「1番地」のような「番」、「番地」をつけないでください。 たとえば、「東京都千代田区永田町一丁目7番」という住所のデータを見たい場合は以下のようにURLを作ります。 トップページからブラウジング URLに直接入力する方法以外

    緯度経度付き住所LODを作りました - Qiita
    gayou
    gayou 2018/11/15
  • 住所で見かける大字(おおあざ)と、字(あざ)の意味は? | 引っ越し見積もりは引越しラクっとNAVI

    引越しラクっとNAVI ® の実際の引っ越しデータから算出しています。 期間:2017年1月~2019年6月実績※引越し見積もり料金や、実際の引越し料金を保証するものではありません。 お引っ越しの際には、見積もり取得をお願いします。 「大字」と「字」の意味と由来は?まず「字」についてですが、「大字」と区別するため「小字(こあざ)」とも呼ばれます。 その起源は豊臣秀吉が行った太閤検地にさかのぼり、元々は年貢を徴収する田畑を管理するために付けていた記号のようなものでしたが、江戸時代に各地の集落が拡大すると、人々が住んでいる場所でも村名の後ろに小字が付き始め、次第に住所(○○の国 △△郡 ××村 字□□、など)として定着していったものとされています。 一方で「大字」の由来は明治時代に市制・町村制へ移行するために行われた市町村合併にあり、その際消滅することになった江戸時代からの村の地名や区画を、

    住所で見かける大字(おおあざ)と、字(あざ)の意味は? | 引っ越し見積もりは引越しラクっとNAVI
  • 1