タグ

ブックマーク / qiita.com (5)

  • 日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita

    先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 さて、このジオコーダーは、住所を正規化してそれを「大字町丁目コード」という12桁の数字に変換し、そのコードをファイル名として GitHub ページ上に大量においた JSON ファイルにアクセスして緯度経度を取得するということをやっています。 つまり、住所の正規化からコードに変換する部分がとても重要で、そもそも正規化に失敗してしまうとどうしようもないという仕様なんです。 さいわい先日経産省が公開した IMI コンポーネントツール である程度のことをやってくれるのですが(というかそうであることを期待したのですが)、いろいろ調べ始めると住所という仕組みはほんとに複雑で、Facebook で絡んでくださった @hfu さんいわくまさに「自然言語処理そのもの」であ

    日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita
    You-me
    You-me 2023/06/06
    歴史好き的には楽しいんだけどデータベース作る人からすると地獄だよね
  • COCOAの開発経緯について調べた - Qiita

    (2021/6/17 思った以上に伸びたため、主語がデカイままだと問題かと思いましたので、タイトルを修正しました。失敗、と当初書いたのは調査のモチベーションのためでしたが、現在進行形で運用されているシステムに対して失敗、と書くのは大変失礼な記述でした。関係者の方々、誠に申し訳ありませんでした。この記事のモチベーションは、COCOAの初回リリースまでを主なターゲットにしており、2020年夏以降のことについては、あまり追えてもいなければ、正直、理解もできておりません。) このメモの目的 COCOAアプリの成り立ちを深く知ることで、COCOAアプリの開発経緯を探りたい。 立ち入らないこと セキュリティ周りの話 Exposure Notification APIの挙動 調査のモチベーション 精神的に苦しい思いをした人が居る 何があったか 現場(厚労省結核感染症課)目線 現場目線は「仕方ない」の連鎖

    COCOAの開発経緯について調べた - Qiita
    You-me
    You-me 2021/06/16
    政府にCOCOAを使う気が微塵もなかったでもいい気がします
  • マクドナルドで一日分の栄養を取れる組み合わせを計算したら衝撃の結果に - Qiita

    コレステロールは最低摂取基準量はないので0としています(実はこれが伏線になっている)。 そして目的は、一日必要な栄養素を満たす最もカロリーの低い商品の組み合わせとします。金に糸目はつけません。健康第一! 解く 商品の数が96個、栄養素の数が16個なので、とても人間の手では解けません。そこでコンピューターの力を借ります。幸いPuLPというPythonで無料で利用できるソルバーがあるので、これで計算します。ちなみにExcelにもソルバーが搭載されていますが、この程度の数の決定変数でもエラーになって計算できませんでした。 # Import PuLP modeler functions from pulp import * # A new LP problem prob = LpProblem(name="mac", sense=LpMinimize) # Variables AA = LpVar

    マクドナルドで一日分の栄養を取れる組み合わせを計算したら衝撃の結果に - Qiita
    You-me
    You-me 2021/02/22
    衝撃の結果と言われてしまうとオチわかってしまう
  • なぜコロナウイルスの感染者数のデータは意味がないのか - Qiita

    Help us understand the problem. What is going on with this article? 以前から言っいることですが、メディアでよく目にする感染者数という数字はあまり意味がないと思います。特にその数字を持ってそれぞれの国を比べようとするときには意味がないどころが害すらあると思います。 というのも、感染者の数というのは検査の数に大きく影響を受けます。そしてその検査をどれだけ、どのように行うかというのはそれぞれの国によって戦略も状況も違います。 しかし現実にはそういったことを考慮することなしに、感染者数の値を毎日見て、一喜一憂し、さらにはそれぞれの国の感染者数の値を比べ、どこの国がいいとか悪いと決めつけ、さらには感染者数の増加のトレンドをもとに「あなたの国もイタリアのようになってしまう」といった、無責任な報道が多くのメディアから毎日垂れ流されていま

    なぜコロナウイルスの感染者数のデータは意味がないのか - Qiita
    You-me
    You-me 2020/04/17
    意味がないだとちょっと言い過ぎかな。数字単独での国際比較はほぼ無意味でいいと思うけど
  • IT業界のルー大柴と渡り合うためのカタカナ用語一覧 - Qiita

    イントロ 別にディスってません。 実際にカタカナめっちゃ飛び交ってますからね。コミットはオフィシャルにアプライとか日語2文字やん。 ということで彼らの会話を理解するために、とりあえずドラフトでアップしちゃって今後アップデートして行きます。 書いとこかな?と思ったものだけ書いておきます。 なぜルー語が飛び交うか 初めに個人的に考察した結果。 技術自体が英語圏から直輸入(プログラミングとか) そのため 日語変換 < カタカナ変換 の方が楽 一言に沢山の情報を詰め込める(エンジニア気質) 漢字二文字くらいの言葉を多用するのもおそらくこの意味合い 上記を踏まえ、わざわざ日語に変換する意味がない ※キリがないので都度更新していく ※一部マーケよりかも ※DAI語は基入れず ※五十音順に訂正(19/9/9) ※いくつか追加(19/9/10) ※アドホック、ワークアラウンド 追加(19/10/9

    IT業界のルー大柴と渡り合うためのカタカナ用語一覧 - Qiita
    You-me
    You-me 2019/09/18
    ここらへんはまだわかるけどロコ語は結構わからない
  • 1