タグ

統計に関するshidhoのブックマーク (27)

  • 「生きたまま統計の教材と化した男がおるらしいな?」例えば校長が5人いたとしよう。 校長A:12000人

    リンク 雨崎景夜の夜景空館 【フィリピン買春】ネットで話題「校長」とは【平均人数を引き上げたレジェンド?】 皆さんこんにちはこんばんは雨崎です。今回は校長について。レジェンド校長とはフィリピンで買春を行なった事で児童ポルノ禁止法違反等の罪で逮捕された人物であり、一部ネット上では「レジェンド」と呼ばれることもあります。「レジェンド校長」についてのス

    「生きたまま統計の教材と化した男がおるらしいな?」例えば校長が5人いたとしよう。 校長A:12000人
  • 風俗客とキャスト「性接触の全国ネットワーク」を可視化 口コミ9万件分析で見えた「世界の狭さ」 - 弁護士ドットコムニュース

    誰と誰が性的な関係を持ったかという性接触のネットワークはHIVなどの感染症予防のために古くから研究されてきた。一方で、もっとも他人には知られたくないプライバシーに関わる内容ゆえに大々的な調査は不可能とされ、その実態は謎につつまれていた。 しかし2022年11月、静岡大学の守田智教授と長崎大学の伊東啓助教らのグループは、性風俗の口コミサイトに寄せられたレビューをもとに全国規模の「性接触ネットワーク」の構築に成功したと発表した。 その内容はどんなものなのか。守田教授と伊東助教が解説する。 「ネット上で公開されている風俗店のレビューはある人とある人が性的接触をした証拠なわけです。これを使ってネットワークを作れないかと考えました。レビューの中から女性キャストの名前と客のハンドルネームだけを抜き出して、誰と誰がつながっているのかというのを収集しました。 例えばAさんが静岡のお店で働くaさんに対して口

    風俗客とキャスト「性接触の全国ネットワーク」を可視化 口コミ9万件分析で見えた「世界の狭さ」 - 弁護士ドットコムニュース
    shidho
    shidho 2023/03/08
    これ前にも似た図を見たんだけど、岩手からの線が微妙な引かれ方をしてるんだよな。このレベルの話だと参考にならない特異点的扱いなのかも。
  • COVID-19 Japan 新型コロナウイルス対策ダッシュボード #StopCOVID19JP

    新型コロナウイルス感染症(国内事例) 現在患者数 / 対策病床数 ※軽症者等は自宅療養など、病床を使用しないことがあります(詳細) (現在患者数 前日より増加 前日より減少) credit APP (アプリ開発/提供): CC BY jig.jp 福野泰介 @taisukef (src on GitHub) 「厚生労働省提供 新型コロナウイルス対策ダッシュボードについて」「感染者PDFデータをJSON-API化して公開」 DATA: CC BY「新型コロナウイルス感染症について - 厚生労働省」→ JSON / CSV / TXT (集約版 CSV / JSON / APP) DATA: CC BY COVID-19 Japan 新型コロナウイルス対策ダッシュボード JSON / CSV / TXT(厚生労働省、各都道府県公表データの集約) DATA: CC BY 「新型コロナウイルス患者

    COVID-19 Japan 新型コロナウイルス対策ダッシュボード #StopCOVID19JP
  • 「2018年の実質賃金大半がマイナス」の舞台裏 - モノシリンの3分でまとめるモノシリ話

    2018年の実質賃金の前年同月比の伸び率の大半がマイナスであることが大きく報道された。 www.yomiuri.co.jp これは1月30日に実施された野党合同ヒアリングがきっかけであるので,参加した当事者として話をまとめておく。 今,厚労省が東京都の500人以上の事業所について,来全数調査すべきところを3分の1程度しか調査していなかったこと等が問題となっている。 しかし,実はもっと重大な問題がその裏に隠れている。 私がヒアリングに呼ばれたのもそれが理由。 簡単に言うと,2018年1月から賃金の算出方向が変更され,従来よりも2000円程度高くでるようになった。 高くなった要因は①サンプルの半分入替②ベンチマーク更新③3倍補正である。 ベンチマークと言うのは,要するに賃金を算出する際の係数のようなものと思えばよい。この更新の影響が大半を占めている。 そして,③の3倍補正というのは,約3分の

    「2018年の実質賃金大半がマイナス」の舞台裏 - モノシリンの3分でまとめるモノシリ話
    shidho
    shidho 2019/02/05
    明石順平、本名なのかな。
  • 統計の不備と、各種統計の「相関」の話 - 山形浩生の「経済のトリセツ」

    Executive Summary 統計の信頼性について疑問を呈した柳下毅一郎のツイートを、山形は一蹴した。が、その後勤労統計の集計方法の不備が露見した。ここから、この統計は捏造であり、それが相関しているならすべての統計が捏造だ、という極論を述べたブログが出た。しかし統計は、一かゼロか、完璧かすべて捏造か、というものではない。またその相互の関係も、機械的な関係があるということではない。信頼性の非常に広い幅の中で上下するだけなので、実際にどんな不備があってどのくらい影響を及ぼすのかを具体的に考えないと、妥当性のない陰謀論に流れてしまうだけだ。 はじめに しばらく前に、柳下毅一郎がこんなツイートをした。 アベノミクスで経済がよくなってるとおっしゃるリフレ派の方々は、なぜ財務省の出す経済指標は捏造されてないと信じられるのだろうか。— Kiichiro Yanashita (@kiichiro)

    統計の不備と、各種統計の「相関」の話 - 山形浩生の「経済のトリセツ」
    shidho
    shidho 2019/01/29
    雑な議論するときには統計は間違ってないもの(もしくは間違いが多いと知られているもの)として扱わないといけないから、間違いが少ないという前提になりやすい日本の統計があれだと言い訳増えるよねと。
  • A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog

    リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら 汎用人型雑用AIの stakaya です。 たまたま数年前に社内のBLOGに書いたABテストのロジックのまとめ&比較記事を発掘したので、 このまま眠らせているのはもったいないぞと、 圧倒的もったいない精神を発揮し、シェアさせていただきます。 あの頃は私も若かった。 社内では”堅物・真面目・一途”で有名なものでして、下記文章がお硬いのはご勘弁ください。 はじめに 記事は、施策の評価手法としてしばしば用いられるA/Bテスト(A/B testing)について、できる限り背後にある仮定を明記した上で、まとめたものである。 A/Bテストとは、主にインターネットマーケティングにおける施策の良否を判断するために、2つの施策(通常、A・Bと記載)を比較す

    A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog
  • [艦これ][大型艦建造] 建造率の推定 大鳳レシピ3600/2000/5300/5200 大和レシピ4010/5000/6000/2500:びいかめのブロマガ - ブロマガ

    回帰分析を用いて、大型艦建造における建造率の推定を行いました。あくまで推定なので実際の確率とは異なる場合があります。参考程度にどうぞ。サンプルとしてしたらばにある艦これ専用掲示板の【報告】大型艦/新型艦建造スレ25【検証】 - 艦これ専用掲示板にて報告された39855件のデータを使用しました。 したらばにて報告のあった1187種類のレシピを、確率が大きく変わらないと推定された、いくつかのグループにまとめ、その中でもっとも資源投入量の少ないレシピの結果として併合しています。レシピごとの報告数が少なくても、グループごとに報告をまとめることで精度を高めています。見たいレシピが表に載っていない場合は、それよりも投入量の少ないレシピを参照してください。 表中にある95%CIとは95%信頼区間の略で、実際の建造率は95%の確率でこの区間の中に納まっていると推定されています。 今回の推定では、開発資材・

    [艦これ][大型艦建造] 建造率の推定 大鳳レシピ3600/2000/5300/5200 大和レシピ4010/5000/6000/2500:びいかめのブロマガ - ブロマガ
    shidho
    shidho 2014/03/07
    正答があるのにその答を直接求められないだけでこれだけ面倒なのに、正答がないのに答を求めようとするときの難しさといったら……。
  • TechCrunch | Startup and Technology News

    Boeing’s Starliner spacecraft has successfully delivered two astronauts to the International Space Station, a key milestone in the aerospace giant’s quest to certify the capsule for regular crewed missions.  Starliner…

    TechCrunch | Startup and Technology News
    shidho
    shidho 2012/11/08
    砂漠の天気予報と熱帯雨林の天気予報は難度が違うけれど、今回はどちらだったのだろう?
  • 海外ネタつれずれ:都道府県のワーストを描いた地図を作ってみた

    Powered By 画RSS February 14, 2011 都道府県のワーストを描いた地図を作ってみた 「The United States of Shame (CHART)」(恥のアメリカ合衆国)という地図が話題になっていました。 アメリカには50の州が存在しますが、この地図ではそれぞれの州に当てはまる「ワースト」なデータを名前にしてしまいました。地元の人たちにとっては迷惑な話ですが、面白いし、興味深いですね。ミシガン州は失業率が高いとかわかりやすいのもありますが、ニューヨークペンシルヴェニア州(指摘してくださってありがとうございます)では放火が多いとは知りませんでした。アメリカには州がありますが、日には都道府県があります。しかも47ですから、アメリカと同じように「ワースト」を当てはめることができるのではないでしょうか。 ということでありきたりに作ってみました。 この地図を作製

    shidho
    shidho 2011/02/15
    降水量ワーストってむしろ褒め言葉だろ。
  • 資料屋のブログ - 出生数と中絶数をだらだら並べてみたり。そしたら少妊娠化が見えてきた

    出典 「でき婚」出生数及び人口 2004年までは厚生労働省「平成17年人口動態特殊報告」。なお、でき婚出生数は「平均的な結婚週数の場合」の数値である。 2005年以降…人口は総務省統計局「平成17年国勢調査」、及び同局「人口推計」、でき婚出生数は厚生労働省「平成22年度「出生に関する統計」の概況 人口動態特殊報告」によった。 20代母出生数 厚生労働省「人口動態統計」 20代の中絶率と20代女子人口当たりのでき婚出生率、20代の母親から産まれた子の数に対するでき婚出生率をグラフにすると次のようである。なお、中絶率と人口当たりのでき婚出生率は千分率、子の数に対するでき婚出生率は百分率である。それぞれ単位が違うのでグラフをご覧の際はよく注意していただきたい。 出生に占める「でき婚」の割合の増加ほどには人口当たりの「でき婚」の割合は増えていない。でき婚が増えたのではなく出生が減ったのだ。〔201

  • ヒトは、『最盛期』から10年経つと、平均で「9.03%」打鍵速度が劣化する……ってゆーか「15.69%」なのかも。 - 雑記/えもじならべあそび on blog

    (関連:ローマ字入力をお使いの方に、お尋ねします。 ※AZIK、ACT、JLOD… - 人力検索はてな) (関連:親指シフトの倉庫 Mac Fan 1月号に親指シフトの記事) 30代の有効投票数161票を元に、打鍵速度の劣化度平均をとってみたところ……主観ベースで「9.03%」打鍵速度が劣化することが判明。 しかも、回答者のうち4割の人たちは「20代前半には、最高速度を経験していない」か「まだローマ字入力に触ってもいない」と考えられそうであり、ほぼ同数が「低下率1.0%(加齢低下曲線と習熟上昇曲線の合成値がフラットになる世代だった)」と回答していた……というところからすると、順序効果を排除すれば……このデータは、 有効回答者88人の平均では、主観ベースで「15.69%」打鍵速度が劣化している。 という風に読むほうが、10代からキーボードに触れているがために、確実に20歳頃のピーク感を経験し

    ヒトは、『最盛期』から10年経つと、平均で「9.03%」打鍵速度が劣化する……ってゆーか「15.69%」なのかも。 - 雑記/えもじならべあそび on blog
    shidho
    shidho 2010/12/19
    「ピークはまだ来ていない」「特に効率は落ちていない」の選択肢なしにアンケートを採った結果での論考なんだが、大丈夫なんだろうか、これ。
  • 「馬券の配当160億円」をどうやって実現したのか - 朝日新聞の補足記事 - アフター・パンデミック

    ちまたの競馬予想会社のうさん臭さは、「そんなに儲かるならなぜ自分で買わない」という言葉で表されるが、ほんとに儲かる人間はやはり自分で馬券を買っていることを証明した事件だと言える。 asahi.com(朝日新聞)が競馬の配当160億円隠す 英国人社長のデータ分析会社という記事を報じているが、新聞紙面ではその隣に関連記事も掲載されているので、これを引用する。 「なぜそんなに稼げた - 3連単を分散買い」(2009年10月9日付朝日新聞より) ユープロ関係者らによると、同社は、天候や出走馬の血統、騎手などの各データを入力、解析する競馬必勝プログラムを使い、高確率で配当金を得ていたという。だが、億単位の資金を使い、ほとんどの組み合わせの馬券を買うという、一般の競馬ファンにはまねできないやり方だった。 05年設立の同社が目をつけたのは、「3連単」という馬券。1着から3着までを順番通り当てるもので、配

    「馬券の配当160億円」をどうやって実現したのか - 朝日新聞の補足記事 - アフター・パンデミック
  • 同人誌1トンを刷った経緯と部数決定のプロセス - ヴィクトリア朝と屋敷とメイドさん

    以前ノウハウとして、倉庫を活用して1トン(1冊1キロを1,000冊)の同人誌を刷った話を書きました。印刷所の倉庫を活用し、大量の在庫を抱えても日常生活に影響を及ぼさない方法でした。 しかし、そもそもサービスがあったとしても、1,000部を頒布できる確信が無ければ、印刷は行えません。部数決定は勘のようなものがありますし、当時友人や話を聞いた人のほとんどは、1,000部は現実的ではないといった反応を見せました。少なくとも表立って1,000部ぐらいいけるのではといってくれたのは、2人だけです。(どちらも同人経験は久我より長いです) この部数は、希望的観測を交えたものもありますが、直感に頼らず、これまでの活動実績と同人イベントで接した方たちの動きから積み上げて推測した結果です。 3年で頒布する計画が3ヶ月で完売したのはひとえにアキバBlog様に取り上げられた幸運によりますが、少なくとも1,000部

    同人誌1トンを刷った経緯と部数決定のプロセス - ヴィクトリア朝と屋敷とメイドさん
  • このままのスピードでエグザイルが増えていけば2040年に地球は滅亡する。 - orangestarの雑記

    *1 *2 上の表をみていただければわかるが、このままエグザイルのメンバーが増え続けることは世界的な脅威である。 最初の数年は大したことがない。しかしこれは倍々ゲームの怖さをしらない素人の考えである。 倍々ゲームは恐ろしい。ネズミ講もインフルエンザのパンデミックも末期癌の爆発的転移も倍々ゲームの所作である。 もう一度図を見てほしい。猛烈なスピードでエグザイルのメンバー数が増え始めるのは、10年後、2020年からである。 乳がんでも当初は米粒大だった癌細胞が20年後、豆粒大になったとたんに爆発的に増殖し、1年後に患者を死に至らしめる。 同様に増殖するエグザイルも横浜市の人口を抜き、北海道の人口を抜き、日の人口を抜き、世界の豚人口を抜き、中国人口を抜き、そして2038年には世界人口を抜き去る。そしてその時世界はエグザイルとかし、終わる。 もう一度いう。 エグザイルの増殖はネズミ講やインフルエ

    このままのスピードでエグザイルが増えていけば2040年に地球は滅亡する。 - orangestarの雑記
    shidho
    shidho 2009/03/23
    もともとエグザイルが0人から7人になって発生したことを考えると、等比でなく等差だと考えるのが適当でありモデルが間違っている。
  • www.tv2ch.info

    2ちゃんねるのTV実況板の勢いをグラフで表示2008年10月12日 06時23分11秒  総レス数:65res/分 #│    局    │  レス数. │ 率 │ 番組 . ━┿━━━━━┿━━━━━┿━━┿━━━━━━━━━━━━━━━━ 1│.テレビ朝日.│  18res/分.│. 28%│渡辺篤史の建もの探訪 2│.TBSテレビ..│  16res/分.│. 25%│時事放談 3│ NHK総合 . │  14res/分.│. 22%│産地発!たべもの一直線 4│.日テレビ.│.   6res/分.│  9%│日曜テレショップ 4│.フジテレビ. │.   6res/分.│  9%│おはよう茨城 6│ NHK教育 . │.   4res/分.│  6%│テレビでハングル講座[再] 7│.テレビ東京.│.   1res/分.│  2%│みんなとてれと

    shidho
    shidho 2009/02/04
    アニメが有意に高いことに注意が必要だけども。
  • ハンバーガー統計学にようこそ! 平均から分散分析まで──親しみのもてる例題

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。

    shidho
    shidho 2008/10/29
    昔読んだようなことがあるようなないような。
  • 単勝1.5倍以下を買い続けると・・・ - 鉄板と言われるような単勝1.5倍以下などの馬を買い続けると回収率はどのくらいになるのでしょうか... - Yahoo!知恵袋

    単勝1.5倍以下を買い続けると・・・ 鉄板と言われるような単勝1.5倍以下などの馬を買い続けると回収率はどのくらいになるのでしょうか?やっぱり控除を引いて75%に近い数字となるのでしょうか? これは例になりませんが、ディープインパクトの単勝を買い続けた場合、回収率は約150%となったはずです。 通常はこんなに上手くはいきませんよね・・・? データがあればおねがいしますm(--)m 当然の結果の様に思われますが、お願いされたので 2001年度 の1番人気の オッズ別回収率 1.0~1.5倍 396頭中 1着213頭 2着084回 3着037回 着外062回 単勝回収率72.70% 複勝回収率88.64% 1.6~2.0倍 694頭中 1着291頭 2着154回 3着092回 着外155回 単勝回収率76.28% 複勝回収率86.89% 2.1~2.5倍 771頭中 1着267頭 2着168回

    単勝1.5倍以下を買い続けると・・・ - 鉄板と言われるような単勝1.5倍以下などの馬を買い続けると回収率はどのくらいになるのでしょうか... - Yahoo!知恵袋
    shidho
    shidho 2008/10/14
    これは面白い。
  • おかげですぐにカラクリが見抜けた - *minx* [macska dot org in exile]

    いまわたしは、反売買春派の人たちと、リアルでいろいろやり取りしいる。 わたしの住んでいるところとそれほど離れていないんだけど、最近街頭売買春増え過ぎじゃね?とかで地域の住民が無茶苦茶怒ってて、集会開いたりデモやって「警察は片っ端から売春婦も客も捕まえろ!刑務所に長い間入れてやれ!」とか騒いでいるので、メディア戦略を含めていろいろあるのね。それでさ。 何百人も集めて公開のパネルをやるというので見に行ったら、パネリストの何人もが「売春をはじめる平均的な年齢は12歳から14歳」という数字を何の疑いもなく提示し、それが当たり前の前提として話がどんどん進んでいくのね。それがもし事実だとすると、売買春とはすなわち子どもの性的搾取とそれ以後みたいなものだ、ということになってしまう。 でも普通に考えれば、それってありえないじゃん? 仮に正規分布に近似しているとすると、平均13歳として、21歳で売春をはじめ

    おかげですぐにカラクリが見抜けた - *minx* [macska dot org in exile]
  • 犯罪の九割は失業率で説明がつく

    松尾匡のページ  08年1月14日 犯罪の九割は失業率で説明がつく (追記:1月16日, 再追記:1月17日) 続報あり。以下の分析結果には「誤差の系列相関」という問題がありました。続報ではその解決に取り組んでいます。 再追記:08年1月17日  下の方の昨日書いた追記で、管賀江留郎さんからいただいた批判のエントリーの中で言われていた、「警察がデータを操作したため相関する」という「説」について、管賀さんご自身の説であるように表現した一文がありました。私自身、気で言われていることかどうかは疑わしいと思っていましたが、ネタと断定することもできず、ああいう表現になりました。  このたび管賀さんとのやりとりの中で、これが管賀さんご自身信じておられない、いわゆる「釣り」のネタであることが明らかになりましたので、当該の表現を削除して訂正します。管賀さんはこれがひとつの積極的主張として一人歩

    shidho
    shidho 2008/01/15
    残りの1割はなんだろう。
  • 多数決がその前提として啓蒙を要求していることを忘れてはならない - OjohmbonX

    多数派が必ずしも正しいわけではない――しかもそうである場合が少なくない――ということは、Yoshiの『Deep Love』シリーズや片山恭一の『世界の中心で、愛をさけぶ』が、大西巨人の『深淵』や金井美恵子の『噂の娘』、笙野頼子の『水晶内制度』、阿部和重の『シンセミア』、中原昌也の『あらゆる場所に花束が……』、鹿島田真希の『一人の哀しみは世界の終わりに匹敵する』などを発行部数なり売上げなりの面で圧倒していたとして、小説の面白さとして圧倒的に劣っているという一事をとっても明らかなのに、多数派の意見をよしとする多数決が様々の場面で多く用いられるのはどういうことなのだろうか。 ・多数派が正しくない場合 ある問題を正しく理解できている人たち(A)と、現時点で理解できていないが理解できるポテンシャルを持つ人たち(B)と、理解できない人たち(C)とがいる、ということを上図は示す。(もちろん、特に正規分布

    多数決がその前提として啓蒙を要求していることを忘れてはならない - OjohmbonX
    shidho
    shidho 2007/08/01
    これは啓蒙する側からの話だが、より多くの意見に目を触れておく必要があるとすれば、Webの意見がクラスタ化していくことは多数決にとって良い結果をもたらさないのではないか。