タグ

ITに関するthondaのブックマーク (4)

  • 日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita

    先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 さて、このジオコーダーは、住所を正規化してそれを「大字町丁目コード」という12桁の数字に変換し、そのコードをファイル名として GitHub ページ上に大量においた JSON ファイルにアクセスして緯度経度を取得するということをやっています。 つまり、住所の正規化からコードに変換する部分がとても重要で、そもそも正規化に失敗してしまうとどうしようもないという仕様なんです。 さいわい先日経産省が公開した IMI コンポーネントツール である程度のことをやってくれるのですが(というかそうであることを期待したのですが)、いろいろ調べ始めると住所という仕組みはほんとに複雑で、Facebook で絡んでくださった @hfu さんいわくまさに「自然言語処理そのもの」であ

    日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita
  • とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro

    「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃ですが(2023年6月6日)、この手の騒動は周期的に起こってる印象です。 ということはつまり いつまで経っても解消されない、解決が困難な課題である その困難さが界隈以外に共有されていない であるわけで、その都度Twitterにトリビアが投下されてはTLが賑わい華やかではありますが、そろそろ自分の整理としてもどれだけ日の住所システムがカオスで、その計算機的な処理がいかに困難かをメモっておこうかと思いました。 なおこの件については既にQiitaにGeoloniaの宮内さんが鼻血の出そうな良エン

    とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro
  • 天才プログラマー登氏に聞く、日本が「海外に負けないICT技術」を生み出す方法

    諸外国に後れを取る日のICT産業。その発展を担うICT人材不足も深刻だ。企業や行政は、どのようにして優秀なICT人材を育成すべきだろうか。「天才プログラマー」との呼び声もあるソフトウェアおよび通信ネットワーク研究者であり、「シン・テレワークシステム」の開発者でもある登 大遊氏に話を聞いた。 ソフトウェアおよび通信ネットワーク研究者。SoftEther VPNを開発・製品化・オープンソース化し、全世界に500万ユーザーを有する。外国政府の検閲用ファイアウォールを貫通するシステムの研究で、筑波大学で博士(工学)を取得。2017年より独立行政法人情報処理推進機構(IPA)サイバー技術研究室を運営。2020年にNTT東日に入社して特殊局を立ち上げ、シン・テレワークシステムを開発。ソフトイーサを17年間経営中。筑波大学産学連携准教授 テレワーク難民を救った「シン・テレワークシステム」 新型コロナ

    天才プログラマー登氏に聞く、日本が「海外に負けないICT技術」を生み出す方法
  • 「訴えてやる!」の前に読む IT訴訟 徹底解説

    IT訴訟事例を例にとり、システム開発にまつわるトラブルの予防と対策法を解説する連載。今回は特別編として、IT紛争の回避と解決のプロフェッショナルであり、IT小説のクリエーターでもある細川義洋氏が、「セクシー田中さんドラマ化」問題を解説する。

    「訴えてやる!」の前に読む IT訴訟 徹底解説
  • 1