タグ

統計に関するhonehonerockのブックマーク (30)

  • 【格ゲー】『俺を獲れ』ウメハラがデータ収集のGeminiさんに厳しい対応をしていた理由が判明!「オレ自身が自分のプレイをデータ収集に近い感じでSF4から見てた」「だからこそ言いたい。メチャレベル低いすよって」 | まじっく ざ げーまー - ゲームのレビュー、攻略、情報サイト

    ストリートファイター6 格ゲーマートーク 【格ゲー】『俺を獲れ』ウメハラがデータ収集のGeminiさんに厳しい対応をしていた理由が判明!「オレ自身が自分のプレイをデータ収集に近い感じでSF4から見てた」「だからこそ言いたい。メチャレベル低いすよって」 今回は、先日おこなわれたウメハラさんの企画「俺を獲れ」での、配信裏話を取り上げます。コメント欄の読者さんから情報を提供してもらいました。 取り上げるのは、SFL2021のデータを収集し、分析した情報を紹介していたGemini(ジェミニ)さんに関する話です。 以下、配信書き起こしです。 ソース元リンク:俺を獲れ振り返り(ウメハラさんのツイッチチャンネル) (アーカイブ50分付近のトーク) トークが長かったので要約で済ませようと思ったのですが、あまりに良い話が出てきたので結局書き起こした部分もあります。カギ括弧内は全てウメハラさんの発言です。 ウ

    【格ゲー】『俺を獲れ』ウメハラがデータ収集のGeminiさんに厳しい対応をしていた理由が判明!「オレ自身が自分のプレイをデータ収集に近い感じでSF4から見てた」「だからこそ言いたい。メチャレベル低いすよって」 | まじっく ざ げーまー - ゲームのレビュー、攻略、情報サイト
    honehonerock
    honehonerock 2023/07/14
    ウメハラ、真っ当なことしか言ってない。「分析とは何か」のお手本みたいな話だと思った。しっかし、信者がとかウメハラの立ち位置がとか、ノイズみたいなブコメ多いなあ……
  • シュートを外した後で、ゴールポストを動かして「入っていた」ということにしてはいけない - 渋谷駅前で働くデータサイエンティストのブログ

    先日こんなことをコメントしたら、思ったよりも反応が多くて「皆さん同じことを思っていたのかな」と感じたのでした。 シュートを外した後でゴールポストを動かして入ったことにするのはダメですよ / 「当初は有意差が認められなかったが、毛乳頭細胞が少ないと思われる被験者を除いて追加解析したころ、塗布24週後の毛髪密度は「含む」を使った被験者のほうが統計学的に有意に上昇したという」 https://t.co/K91NElUAgN— TJO (@TJO_datasci) 2023年6月6日 要はこれは再現性問題の典型例だという話なんですが、近年あれだけ再現性問題が騒がれた割には意外と未だに世間的にはあまり広く知られていないのだろうか、という気もしています。 このブログでも再現性問題については一通り論じたことがありますが、ちょうど良い機会なので改めてこの手のQRPs (Questionable Resea

    シュートを外した後で、ゴールポストを動かして「入っていた」ということにしてはいけない - 渋谷駅前で働くデータサイエンティストのブログ
    honehonerock
    honehonerock 2023/06/10
    事後の選別、ダメ、絶対。
  • 東浩紀さん「西浦氏のような発想は原理的に優生思想と変わりません。リベラルは批判し抵抗すべきです。」

    まとめ 東浩紀氏「どうやって米欧は医療崩壊を乗り越えたか、あるいは共存しているかを学び、政策に活かすべきではないでしょうか」 東浩紀氏のコロナ、緊急事態宣言、医療崩壊の主張とそれに対する医療関係者等の反応 35887 pv 95 9 users 12

    東浩紀さん「西浦氏のような発想は原理的に優生思想と変わりません。リベラルは批判し抵抗すべきです。」
    honehonerock
    honehonerock 2020/07/18
    確かに、西浦氏の意見はナチの「合理性」に基づく失敗を踏まえてないように聞こえる。批判は仕方ない。ウイルス死を防ぐために、その他の資源や自由を蕩尽しても良いみたいな風潮って「健康のためなら死ねる」だし。
  • 確率とともに生きる – sociologbook

    新型コロナウィルス、というものが流行っていて、この春はすべてのイベントが中止や延期になり、公的な施設には閉鎖されるところもでてきて、学校も全国で一斉に休校にするかどうかという話があり、そのわりには朝の満員電車はあいかわらずで、それからやっぱりデマもとびかっている。 ドラッグストアやコンビニの店頭からマスクが消え去り、さらにトイレットペーパーがマスクと同じ材料で、もう中国から入ってこなくなるので売り切れるだろうというデマがひろがって、トイレットペーパーも店頭からなくなった。コストコに長蛇の列ができたとか、対応していたドラッグストアの店長がになったとか、そういう記事をたくさん読んだ。 いったい誰がどういう意図で流すのか知らないけど、30度ぐらいのぬるま湯を飲むと熱に弱いコロナが死ぬ、というデマもかなり広がって、さすがにこれは笑った。体温より低いやん。 まあ、しかし笑えない。若年者の致死率は低

    honehonerock
    honehonerock 2020/03/04
    岸先生、不妊治療されてたのか。統計は「人事を尽くして天命を待つ」の人事と天命をいわば混ぜる記述をする。果てしない科学の発展が人事の領域を限りなく広げてきた結果、人はいつまでも天命を待つモードに至れない
  • ExcelでPowerQueryを使ってデータ収集分析 - Qiita

    はじめに Excelにデータを集めようとするとき、数式とVBAを駆使して行う方法が一般的です。 キーを使って複数のデータを結合するときには、Accessなども用いられます。 ですが、データが増えてくると下記のような課題が発生してきます。 収集に必要な手順が増え、数式やVBAが複雑化する データ収集に長い時間がかかる サイズが巨大化して格納しきれなくなる これらの課題を解消するツールとして PowerQuery を紹介します。 PowerQueryとは 2016年に公開されたMicrosoft製のデータ分析Excelアドインであり、Excel2010以降に対応しています。 ファイル・DBWebサービス等からデータを読み込み、変換・加工してExcelのシートに出力できます。 VBAのマクロの記録と同じように、画面上で操作するとクエリ(読み込み手順の定義)が生成されます。 複雑な加工をしない

    ExcelでPowerQueryを使ってデータ収集分析 - Qiita
  • 62 Universities Have Partnered With Coursera - Coursera.org

    Learn without limitsStart, switch, or advance your career with more than 7,000 courses, Professional Certificates, and degrees from world-class universities and companies. Join for FreeTry Coursera for Business

    62 Universities Have Partnered With Coursera - Coursera.org
  • 【日本の生き死にの統計をイラスト化】にほんのいちにち | オモコロ

    1日に1700人が死に、600人が離婚している。2700人が生まれ、3550人が死んでいる……。日という国で起こっていることをイラストにまとめてみました。

    【日本の生き死にの統計をイラスト化】にほんのいちにち | オモコロ
    honehonerock
    honehonerock 2017/02/02
    いい……。
  • ゲルマン先生の「役に立つ統計用語集」 - StatModeling Memorandum

    この記事はゲルマン先生(Andrew Gelman)の許諾を得て、Handy statistical lexiconを日語訳したものです。元記事の用語集は現在も更新中です。英語に抵抗がない人はぜひ元記事を読んで下さい。訳語に関しては親しみやすさを重視し、多くの日人にあまりなじみのないと思われる言葉や地名は変え、難しい熟語は避けました。また、訳注はリンク先の要約をしばしば含みます。 ここで取り上げるものはすべて重要な手法や概念である。それらは統計学に関連しており、よく知っておくべきにもかかわらずあまり知られていないものだ。それらに名前を与えることで、そのアイデアがもっと親しみやすいものになってほしいと思う。 ミスターP: マルチレベル(階層モデル)で回帰し、事後層別化(poststratification)する手法のこと。 秘密兵器: ある統計モデルを複数の異なるデータセットに繰り返しあ

    ゲルマン先生の「役に立つ統計用語集」 - StatModeling Memorandum
    honehonerock
    honehonerock 2016/10/02
    ふむふむと思って読んでたが、余談のエイミー・カディのパワーポーズ効果無しのくだりが結構衝撃的だった。まじかー。
  • 仮説検証とサンプルサイズの基礎 - クックパッド開発者ブログ

    パートナーアライアンス部 森田です。有料会員の獲得施策や、それに関わるサービス内動線の最適化を担当しています。 記事の対象 仮説検証を通じて何かを改善をしたいと思っている人 仮説検証の際に「どれくらいのデータを集めたら良いか」分からない人 はじめに 仮説検証とは「仮説を立て、それを証明するためのデータを集め、真偽を確かめること」です。今回は仮説検証を行う際の手順と、その検証に必要なサンプルサイズの考え方を説明します。サンプルサイズの話のみ関心があるかたは、前半を飛ばし「サンプルサイズの決め方」を読んでください。 目次 記事の対象 はじめに 目次 仮説検証のつくりかた 1. 仮説をたてる 2. 施策/KPIを考える 3. 仮説検証後のアクションを決める 4. 対象を決める 5. サンプルサイズを計算する サンプルサイズの決め方 答えを先に サンプルサイズを決める二つの要素 「二つの平均値」と

  • 【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita

    統計学や機械学習をを勉強していると「尤度」という概念に出会います。まず読めないというコメントをいくつかいただきましたが、「尤度(ゆうど)」です。「尤もらしい(もっともらしい)」の「尤」ですね。犬 じゃありませんw 確率関数や確率密度関数を理解していれば数式的にはこの尤度を処理できると思うのですが、少し直感的な理解のためにグラフィカルに解説を試みたいと思います。 コードの全文はGithub( https://github.com/matsuken92/Qiita_Contents/blob/master/General/Likelihood.ipynb )にも置いてあります。 正規分布を例にとって 正規分布の確率密度関数は f(x)={1 \over \sqrt{2\pi\sigma^{2}}} \exp \left(-{1 \over 2}{(x-\mu)^2 \over \sigma^2

    【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita
  • 可視化で理解する「負の二項分布」 - ほくそ笑む

    みどりぼんでカウントデータの過分散対策のために使われると書かれている負の二項分布ですが、Wikipediaの説明を読んでもよく分かりません。 そこでおススメなのが、このスライドです。 負の二項分布について from Hiroshi Shimizu ようするに、負の二項分布は、 がガンマ分布に従うようなポアソン分布だと思えばだいたい OK みたいです。 今日はこれを可視化してみます。 負の二項分布(Negative Binomial Distribution) 負の二項分布はパラメータを 2つ持ちます。成功回数を表す と成功確率を表す です。 統計言語 R には負の二項分布に従う乱数を生成する関数 rnbinom() があり、これらのパラメータはそれぞれ引数 size と prob に対応しています。 したがって、, の負の二項分布は次のようにして描画できます。 negative_binom

    可視化で理解する「負の二項分布」 - ほくそ笑む
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
    honehonerock
    honehonerock 2015/04/15
    Rで使えるデータセットのまとめ。
  • 速水桃子「パターン認識と機械学習入門」

    IBIS 2021 https://ibisml.org/ibis2021/ における最適輸送についてのチュートリアルスライドです。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-ru-men

    速水桃子「パターン認識と機械学習入門」
    honehonerock
    honehonerock 2015/02/01
    かっこいい話の仕方をしはるなー
  • お金がすべてではないけれど、お金もある程度は効く。 - 山形浩生の「経済のトリセツ」

    ビヨルン・ロンボルグが言及していたので知った報告書。 Legatum Institute, Commission on Wellbeing and Policy Wellbeing and Economy (pdf) まだ読みかけだけれど、なかなかおもしろいわー。作った委員はアンガス・ディートンからレイヤードなど、えらい人いっぱいで、非常にきちんとしたもの。 で、この中で出てくるのが冒頭に挙げたグラフ。職業別に見た、平均年収人生満足度。これを「幸福」と解釈すべきかどうかは議論のわかれるところ。「幸せ」「人生の満足度」「福祉」といったことばの選択で、この手の調査の結果がごろごろ変わるのは有名だから。でも、まあ幸福みたいなもんですな。 明らかに全体的な傾向としては、満足度と年収とには相関があって、しかも収穫逓減が効いてるらしい。だけれど、職業別の差は非常に大きい。酒場のオヤジ (public

    お金がすべてではないけれど、お金もある程度は効く。 - 山形浩生の「経済のトリセツ」
    honehonerock
    honehonerock 2015/01/06
    幸せはお金だけじゃないけど、お金もいる!ってめっちゃくちゃ普通の結論なんだが、ちゃんとグラフにできたの凄いなー!
  • ピケティ『21世紀の資本』:せかすから、頑張って急ぐけれど、君たちちゃんと買って読むんだろうねえ…… - 山形浩生の「経済のトリセツ」

    Note (2014.08.04) What follows are some rants by the Japanese translator of "Capital in the 21st Century." I realized that it can be taken out of context (and that some people actually do such things), so I guess I need to explain what's going on. The whole piece was intended to serve as a half-joke expectation management. In Japan, there was some false rumor about the timing of the Japanese trans

    ピケティ『21世紀の資本』:せかすから、頑張って急ぐけれど、君たちちゃんと買って読むんだろうねえ…… - 山形浩生の「経済のトリセツ」
    honehonerock
    honehonerock 2014/09/04
    「先進国では富の格差が広がる方向にある。理由は経済成長率よりも資本の収益性が高いから。自然に解決はされない方向なので金持ちから金取るべき。以上」とのこと。
  • 「幸せは加速度センサで測れる」:日経ビジネスオンライン

    矢野:そうですか。 店舗の中で、居場所と体の動きを検知できるセンサを従業員が身に着けて、来店したお客様にも買い物の間だけ身に着けてもらい、毎秒20回ずつひたすらデータを取り続けるわけですが、それを解析した人工知能コンピュータがすごく意外な影響要因をはじき出した。 店内のいくつかの「ある特定の場所」に従業員が「いる」だけで顧客単価が向上するというんですね。そこでの滞在時間を1.7倍にしただけで顧客単価が15%も増えたとか。でもそれがどういう理由なのか言葉ではうまく説明できない。これは、具体的にはどういうことをコンピュータでやっているんですか。 矢野:ごく単純に言うと、1人のお客さんがいくらお金を使うかという売り上げというマクロな量に対して、影響を与えるかもしれない要因はものすごくたくさんあります。そのたくさんの要因の中で、影響がありそうな候補を何千個、何万個と自動で作り出し、かつそれらを絞り

    「幸せは加速度センサで測れる」:日経ビジネスオンライン
    honehonerock
    honehonerock 2014/08/29
    直感的にも感じる、人間のふるまいを規定している法則があるよね、ていうのが統計的に見えてきて、人間の推測を超える推測もできたと。僕の興味は、そのふるまいに、どこまでヒトが介入できるんだろうっていうとこ。
  • サンクトペテルブルクのパラドックス - Wikipedia

    ダニエル・ベルヌーイ サンクトペテルブルクのパラドックス (St. Petersburg paradox) は、意思決定理論におけるパラドックスの一つである。極めて少ない確率で極めて大きな利益が得られるような事例では、期待値が発散する場合があるが、このようなときに生まれる逆説である。サンクトペテルブルクの賭け、サンクトペテルブルクの問題などとも呼ばれる。「サンクトペテルブルク」の部分は表記に揺れがある。 1738年、サンクトペテルブルクに住んでいたダニエル・ベルヌーイが、学術雑誌『ペテルブルク帝国アカデミー論集』の論文「リスクの測定に関する新しい理論」で発表した。その目的は、期待値による古典的な「公平さ」が現実には必ずしも適用できないことを示し、「効用」(ラテン語: emolumentum)についての新しい理論を展開することであった。 パラドックスの内容[編集] 偏りのないコイン[注釈 1

    サンクトペテルブルクのパラドックス - Wikipedia
    honehonerock
    honehonerock 2014/08/21
    期待値が求められないギャンブルの話
  • 統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!

    稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ

    統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!
  • データマイニングで理想の彼女をGetだぜ! - 発声練習

    ある国際会議のkeynote Speechの中で紹介されていた話。非常に面白かった。 Wired: How a Math Genius Hacked OkCupid to Find True Love 「いまどきの若い男は、なんでもコンピュータか!」とか思われるかもしれないけど、何をしたのかを読んでみると「これって、単なるナンパの方が楽だったんじゃないか?」と思わされる。 登場人物のスペック この人の経歴がアメリカ的。 名前:Chris McKinlay (35歳) 経歴 2001年:Middlebury College を卒業。専攻は中国語 同年:世界貿易センターで中国語から英語への翻訳のアルバイト。アルバイトを辞めた5週間後に9・11。 〜2002年:その後、友達に誘われて、an offshoot of MIT’s famed professional blackjack team に

    データマイニングで理想の彼女をGetだぜ! - 発声練習
    honehonerock
    honehonerock 2014/05/14
    「データサイエンティストはクラスタリングをした!効果はばつぐんだ!」
  • なぜ、統計学が最強の学問なのか?

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 統計学が最強の学問である 2013年1月に発売されるや、ビジネス・経済書としては異例のベストセラーとなり、統計学ブームの端緒となった『統計学が最強の学問である』。同書の発刊1周年と30万部突破を記念して行われた、著者の西内啓氏と二人の科学者[多摩大学情報社会学研究所所長・公文俊平氏、物理学者・楽天株式会社執行役員・北川拓也氏]との対談を公開する。 バックナンバー一覧 35万部を突破

    honehonerock
    honehonerock 2014/04/25
    “同じ質問を何回もいただく。それは「なぜ、統計学が最強なんですか?」というものだ。”って本の真意伝わってないじゃんwって思った。