タグ

統計に関するpochi-mkのブックマーク (7)

  • 私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD

    文:Daniel Sim 分析:Lee Shangqian、Daniel Sim、Clarence Ng ここ数ヶ月、シンガポールのMRT環状線では列車が何度も止まるものの、その原因が分からないため、通勤客の大きな混乱や心配の種となっていました。 私も多くの同僚と同じように環状線を使ってワンノースのオフィスに通っています。そのため、11月5日に列車が止まる原因を調査する依頼がチームに来た時は、ためらうことなく業務に携わることを志願しました。 鉄道運営会社SMRTと陸上交通庁(LTA)による事前調査から、いくつかの電車の信号を消失させる信号の干渉があり、それがインシデントを引き起こすことが既に分かっていました。信号が消失すると列車の安全機能である緊急ブレーキが作動するため、不規則に電車が止まる原因となります。 しかし8月に初めて発生した今回のインシデントは、不規則に起こっているように見えるた

    私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD
  • 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料

    「第5回 プログラマのための数学勉強会 発表資料 (2015/11/21[sat])」 内容は統計学の素養がある方には基的な事項ですが、ベクトルと内積で見方を変えてみたという点と、あまり統計学に親しみがない方にも理解してもらえるようなまとめになっている、というところにスライドの独自性があると考えていますので、その辺り良ければご覧ください^^Read less

    「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
  • 【サッカー】ポアソン分布を使ってtoto予想してみた。 - 実験スピリッツ

    あらゆるスポーツはデータ分析によって評価されています。今回はサッカーです。 調べてみた結果、試合のゴール数はポアソン分布(正規分布)に従うと仮定できるそうで、簡単そうなのでやってみます。 ※かなり前に実験してみた結果なので、その辺はご容赦下さい。 ポアソン分布とは ポアソン分布は平均値を変数として使用することで、ある事象が起こる確率を求めることができます。 今回の場合、λに平均得点、kに得点の0点~3点を代入します。 例えば、2015年サンフレッチェ広島は1ゲームあたり平均2.03ゴールを得点する可能性があります。この情報をポアソン方程式に当てはめると、広島が試合で0ゴールになる確率は13%、1ゴールは27%、2ゴールは27%、3ゴールは18%になります。簡単ですね。 しかしながら、サッカーは対戦相手あってのものです。単純に、これをそのまま利用するのは適切ではありません。 検証する対象試合

    【サッカー】ポアソン分布を使ってtoto予想してみた。 - 実験スピリッツ
  • データマイニングで理想の彼女をGetだぜ! - 発声練習

    ある国際会議のkeynote Speechの中で紹介されていた話。非常に面白かった。 Wired: How a Math Genius Hacked OkCupid to Find True Love 「いまどきの若い男は、なんでもコンピュータか!」とか思われるかもしれないけど、何をしたのかを読んでみると「これって、単なるナンパの方が楽だったんじゃないか?」と思わされる。 登場人物のスペック この人の経歴がアメリカ的。 名前:Chris McKinlay (35歳) 経歴 2001年:Middlebury College を卒業。専攻は中国語 同年:世界貿易センターで中国語から英語への翻訳のアルバイト。アルバイトを辞めた5週間後に9・11。 〜2002年:その後、友達に誘われて、an offshoot of MIT’s famed professional blackjack team に

    データマイニングで理想の彼女をGetだぜ! - 発声練習
    pochi-mk
    pochi-mk 2014/05/14
    ある意味、ハッカーの鏡のような人だ。
  • コンビニの出店戦略を地図にしてみたら...

    コンビニの出店戦略の実態に関しては厳密な検証情報はなく、特定都市における出店数を比較したようなものや、単に四国にセブンイレブンが出店していないという情報を根拠にしたものが多数見られます。データが手元にあるので、このドミナント出店戦略を数値化、可視化してみます。

    コンビニの出店戦略を地図にしてみたら...
  • 野良データを撃つ銀の弾丸はない - 雑種路線でいこう

    でもオープンデータの取り組みが大きく動き始めた。昨年7月にIT戦略部が電子行政オープンデータ戦略を発表し、12月に電子行政オープンデータ実務者会議が立ち上がり、2月に入ってオープンデータIDEABOXで意見を募集し始めている。さっそく経済産業省がOpenData METIを立ち上げてデータを公開し始めた。公開に当たっては利用者が扱いやすいフォーマットで提供できるに超したことはないが、準備に時間をかけるよりはExcelで構わないから提供可能な文書から公開し、フィードバックを受けて段階的に改善した方がいい。 政府の保有している情報のうち統計や地図、道路情報など利用価値の明確なものは既に公開または商用化されている。これから公開するデータとして検討の俎上に上がるとすれば、何らかの行政目的のために収集され、ビジネスや学術分野で副次的な利用価値があり、かつプライバシー等の課題をクリアして公開でき

    野良データを撃つ銀の弾丸はない - 雑種路線でいこう
  • 少しの手間で説得力アップ!意外と使える官公庁の統計データ利用法 : LINE Corporation ディレクターブログ

    こんにちは、ウェブサービス部の鳴海です。 突然ですが、あなたが24歳男性だったとすると、同い年の年男は日全国で何人いるでしょう? また36歳男性には、同じく年男の同級生は何人いるでしょうか? 答えは、24歳男性が64万人、36歳男性が87万人。実は、世代間で20万人以上の差があります。また、今年の年男・年女世代の中で、最も人口の少ない12歳女性(57万人)と最も人口の多い48歳男性(89万人)では1.5倍以上の開きがあります。最近、身の回りに小学生の女の子よりも中年男性の方が多いなと思っていましたが、気のせいではなかったようです。 同級生の人口なんて普段意識することはないですが、仕事をする上ではたまに大事だったりします。いま自分が手がけているサービスのターゲットはどの層で、人口で言えばどのくらいの規模なのか、前後の世代に比べてどのような傾向があるのかなどは感覚的に掴めているといいですね

    少しの手間で説得力アップ!意外と使える官公庁の統計データ利用法 : LINE Corporation ディレクターブログ
  • 1