タグ

統計に関するokishima_kのブックマーク (49)

  • 最も「ありそうで存在しない漢字」は何か? - Qiita

    タイトルが全てです。 個々のパーツとしてはありふれた部品なのに、合体させると「存在しない漢字」になる組み合わせは一体何なのか調べてみました。 ※この記事は TSG Advent Calendar 2022 の14日目の記事です。 手法 以下の手順で「ありそうで存在しない漢字」を調べることにしました。 すでに存在する漢字を構成する部品を調査する 出現回数が多い部品どうしを組み合わせ新たな漢字を作る 構成する部品の出現頻度から、それぞれの組み合わせの「ありそう度」をスコア付けする スコアが最も高いものを「最もありそうで存在しない漢字」とする CHISE 漢字構造情報データベースは、Unicodeに収録されている全漢字を含むさまざまな漢字の部品構造をデータベース化したオープンデータです。今回はこちらのデータを利用して調査を行うことにしました。 頻出部品を調査する UnicodeのCJK統合漢字か

    最も「ありそうで存在しない漢字」は何か? - Qiita
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
  • “外資系コンサルが入社1年目に学ぶ資料作成の教科書”の帯 : 市況かぶ全力2階建

    決算発表が出ないことを怪しんでストップ高まで買われたエックスネット、TOBされるどころか逆に資提携解消で切られて過剰にお金が流出するお笑い劇場に

    “外資系コンサルが入社1年目に学ぶ資料作成の教科書”の帯 : 市況かぶ全力2階建
  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

  • 相変わらず子どもの犯罪被害・非行は少なくなっているし、犯罪不安も落ち着いてきている - 斗比主閲子の姑日記

    先日、こんな記事を書いたのですが、 「母は生後10月で離乳を強行した」(文藝春秋、神戸連続児童殺傷事件家裁審判「決定」全文より) - 斗比主閲子の姑日記 元々、文藝春秋に家裁審判の決定全文が掲載されていることを紹介されていたid:font-daさんが、その次の記事で、 なぜ、あなたが加害者を憎むのか? - キリンが逆立ちしたピアス 以下のが犯罪加害者関係で参考になると紹介されていたので読んでみました。2006年発売の新書で今となってはちょっと古いけれど、Amazonでの評価はとても高い。 犯罪不安社会 誰もが「不審者」? (光文社新書) 作者: 浜井浩一,芹沢一也 出版社/メーカー: 光文社 発売日: 2006/12/13 メディア: 新書 購入: 7人 クリック: 167回 この商品を含むブログ (94件) を見る 今回、このブログで書く内容は、この自体の簡単な紹介と、に掲載されて

    相変わらず子どもの犯罪被害・非行は少なくなっているし、犯罪不安も落ち着いてきている - 斗比主閲子の姑日記
  • 豚さんはTwitterを使っています: "ポーランドの高校卒業試験(合格最低点は30%以上)の成績分布と、イギリスの救急車(到着目標は8分以内)の到着時間分布。もう少し上手くやれよ。 http://t.

    ポーランドの高校卒業試験(合格最低点は30%以上)の成績分布と、イギリスの救急車(到着目標は8分以内)の到着時間分布。もう少し上手くやれよ。 pic.twitter.com/ajnSB8fnjN

  • 因子分析の固有値・固有ベクトルって何? - 小人さんの妄想

    おかげさまで、「統計データをすぐに分析できる」が発売されました。 統計データをすぐに分析できる――社長から「コレを分析して」と言われても困らない! 作者: 中西達夫出版社/メーカー: アニモ出版発売日: 2013/12/13メディア: 単行(ソフトカバー)この商品を含むブログ (2件) を見る こうして形になると、素直に嬉しいです ヾ(´∀`)ノ♪ このを作るにあたって、幾つかの原稿はページの都合上ボツとなっています。 その中の1つに、「因子分析の固有値・固有ベクトルって何?」というものがあります。 固有値・固有ベクトルというものは統計入門の鬼門で、まともに始めるとドップリ数学に浸らないといけません。 何とか簡単なイメージだけでも伝えられないかと思って用意したのが、以下の説明です。 に載せられなかったので、おまけとしてここに公開しておきます。 - 主成分分析・因子分析をひもとくと

    因子分析の固有値・固有ベクトルって何? - 小人さんの妄想
  • TechCrunch | Startup and Technology News

    True Fit, the AI-powered size-and-fit personalization tool, has offered its size recommendation solution to thousands of retailers for nearly 20 years. Now, the company is venturing into the generative AI

    TechCrunch | Startup and Technology News
  • ゲームで操作できるキャラクターの男女比 2014年のランキングから - 最終防衛ライン3

    ゲームにおける女性主人公の少なさとジェンダー問題 - 田舎で底辺暮らし 特に調べもせずに、個人の偏見で一般化するのはよくないと思います。この点は既に、一部の事例でもってゲームにおいて女性主人公が少ないとするのは過度な一般化ではないか (斗比主閲子の姑日記) とも指摘されています。 具体的なデータとしては、日ゲーム男女平等です。 (狐の王国) において2014年に発売された3DS向けタイトル100の集計があります。 これによると、男性主人公が25で、女性主人公が15と男性の方が多いですが、30のタイトルでは男女どちらのキャラクターも選択可能となっています。 日における傾向を3DSのタイトルで検討するのは妥当だと思いますが、3DS以外の動向や、海外との比較をしてみたかったので調べてみました。 日と英国は年間売り上げトップ100から集計。北米は年間トップ100がなかったので、月毎のト

    ゲームで操作できるキャラクターの男女比 2014年のランキングから - 最終防衛ライン3
  • How to Lie with Data Visualization

    Data visualization is one of the most important tools we have to analyze data. But it’s just as easy to mislead as it is to educate using charts and graphs. In this article we’ll take a look at three of the most common ways in which visualizations can be misleading. Truncated Y-AxisOne of the easiest ways to misrepresent your data is by messing with the y-axis of a bar graph, line graph, or scatte

    How to Lie with Data Visualization
  • WUG!、ラブライブ、アイマスの出演声優の年齢比較してみた - 8割妄想Blog

    WUG! 名前 生年月日 年齢 吉岡茉祐 1995年11月7日 18 永野愛理 1993年1月19日 21 田中美海 1996年1月22日 18 青山吉能 1996年5月15日 17 山下七海 1995年7月19日 18 奥野香耶 1991年3月1日 22 高木美佑 1996年9月8日 17 ラブライブ 名前 生年月日 年齢 新田恵海 不明 南條愛乃 1984年7月12日 29 内田彩 1986年7月23日 27 三森すずこ 1986年6月28日 27 飯田里穂 1991年10月26日 22 Pile 1988年5月2日 25 楠田亜衣奈 1989年2月1日 25 久保ユリカ 1989年5月19日 24 徳井青空 1989年12月26日 24 平均 25.4 アイマス 名前 生年月日 年齢 中村繪里子 1981年11月19日 32 今井 麻美 1977年5月16日 36 浅倉 杏美 198

    WUG!、ラブライブ、アイマスの出演声優の年齢比較してみた - 8割妄想Blog
  • 正規分布の意味するところを教えてください。…

    正規分布の意味するところを教えてください。どんな式であるかはわかりますが、 ・なぜこれが重要な確率分布とよくいわれるのか ・実際にどのような事象がこれに従うのか (これは一様分布だけどこれは正規分布、といった具体例が示されると助かります) について教えてください。

  • BLOGOS サービス終了のお知らせ

    平素は株式会社ライブドアのサービスを ご利用いただきありがとうございます。 提言型ニュースサイト「BLOGOS」は、 2022年5月31日をもちまして、 サービスの提供を終了いたしました。 一部のオリジナル記事につきましては、 livedoorニュース内の 「BLOGOSの記事一覧」からご覧いただけます。 長らくご利用いただき、ありがとうございました。 サービス終了に関するお問い合わせは、 下記までお願いいたします。 お問い合わせ ※カテゴリは、「その他のお問い合わせ」を選択して下さい。

    BLOGOS サービス終了のお知らせ
  • 「サイコロを1度しか降れない場合1の目が出る確率は1/2」という確率論 分からない人のために作者が回答 : 哲学ニュースnwk

    2013年09月19日14:30 「サイコロを1度しか降れない場合1の目が出る確率は1/2」という確率論 分からない人のために作者が回答 Tweet 1: ボマイェ(庭):2013/09/19(木) 10:57:51.54 ID:F25FbNPE0 ■理系代表作家、支倉凍砂先生の確率論 (通称:サイコロポエム、サイポエ) サイコロを一度しか降れなければ 一の目が出る確率は その目がでるか出ないかの二分の一である たくさんの回数を降れてこそ さいころのそれぞれの出る目は六分の一なのである だとするならば どうして人はこれほどまでにたくさんの可能性を未来に見るのであろうか 人はある瞬間を一度しか生きられない ある場面である判断を下せるのは人生においてただ一度である 人生は様々なサイコロをただ一度だけ降る行為を繰り返すことの積み重ねである だとするならば そこに可能性を見ることなど馬鹿げた事なの

    「サイコロを1度しか降れない場合1の目が出る確率は1/2」という確率論 分からない人のために作者が回答 : 哲学ニュースnwk
  • 平均の罠 | 平均は真実か? | Busy-ness Review.

    一定期間更新がないため広告を表示しています

    平均の罠 | 平均は真実か? | Busy-ness Review.
  • 「平均」のウソ八百とバカさ加減! | 考えるための書評集

    人の平均所得とか平均貯蓄額の高さをみてどきっとして自分の低さに嘆いたことはないだろうか。なんで世間はこんなに高いんだろうと不思議に思ったことはないだろうか。同じように江戸時代や発展途上国の「平均寿命」の20歳とか30歳とかの低さに疑問を感じたことはないだろうか。 どうもおかしいなとかなんだとか違うんじゃないかと思っている人はまともで、ハナから信じ込んでいる人もかなりいるのだろう。むかしやよその国の人は30歳くらいまでしか生きられなかったと大マジメに信じいてたりする。 「平均」という数字のマジックはどうしてこう愚かな誤謬を植えつけてしまうのか。どうして「平均」の誤解を世間や学校はちゃんと啓蒙しないのか。かくいう私も「平均」のウソっぱちの正確な理由を知らなかったので統計のウソについてのを読みたかったのだが、ネットで調べてみたら、いくらかはそのからくりについて知ることができた。各種資料をコ

  • はてなブログ | 無料ブログを作成しよう

    思いは言葉に。 はてなブログは、あなたの思いや考えを残したり、 さまざまな人が綴った多様な価値観に触れたりできる場所です。

    はてなブログ | 無料ブログを作成しよう
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • 老若男女の音楽の好みについて、X-Yグラフとタグクラウドを組み合わせて解析した図

    どんな音楽が、どんな世代に人気があるのか?男性・女性が好きなバンドはそれぞれどういうジャンルのものか?という疑問についてデータを集計し、グラフと「タグクラウド」を組み合わせて表現した図です。音楽の好みも面白いのですが、そこから伺える男女のある違いについてもなかなか興味深い結果が出ています。 これは、音楽配信サイトLast.fmにインターンとして参加していたホアキム・ヴァン氏が作成したもの。「ある年代・性別のグループにうまく溶け込むのに聞いていないといけない音楽はなんだろう?」という疑問からデータの収集を開始したそうです。 それではまず、男女・年代グラフにアーティスト名を重ねたもの。横軸が年代、縦軸は真ん中が男女同数と考えて、上にいくほどより男性に好まれていることを表します。文字の大きさはそのバンドの人気を表します。 20代の男女が共に好むのは、ド定番のザ・ビートルズ。同世代では男性はスレイ

    老若男女の音楽の好みについて、X-Yグラフとタグクラウドを組み合わせて解析した図
  • ベンフォードの法則 - { 適用と制限 }Wikipedia

    上に示した2つの図は、対数スケールの上にプロットした2つの確率分布である[注 1]。どちらの図でも、赤で示した部分の面積が最初の桁が1である確率に比例しており、青で示した部分の面積が最初の桁が8である確率に比例している。 左側の分布では、赤と青の領域の面積比はおおよそそれぞれの幅の比に等しくなっている。幅の比は普遍的で、ベンフォードの法則によって厳密に与えられる。したがって、こうした確率分布に従う数値はおおむねベンフォードの法則に従う。 一方、右の分布では、赤と青の領域の面積比はその幅の比から大きく外れている。右の図でも幅の比は左側の分布と同じになっている。赤と青の領域の面積比は、その幅よりもむしろ高さの比に依存して決定されている。幅と異なり高さはベンフォードの法則に普遍的な関係を満たさない。代わりにその数値の分布の形によって完全に決定される。したがって、1桁目の数値の分布はベンフォードの