![Amazon.co.jp: なぜ、男子は突然、草食化したのか: 統計データが解き明かす日本の変化: 本川裕: 本](https://cdn-ak-scissors.b.st-hatena.com/image/square/b4062ec6c3dfb620ae5ff4f510cd064b9573c5cb/height=288;version=1;width=512/https%3A%2F%2Fm.media-amazon.com%2Fimages%2FI%2F51qiBsTvL-L._SL500_.jpg)
機械学習など主に予測を目的とした統計手法に強いイメージのPythonでしたが、統計的因果推論を行うためのライブラリ、“DoWhy”がついにリリースされました。 DoWhy | Making causal inference easy — DoWhy | Making Causal Inference Easy documentation これまで因果推論があまり浸透してこなかった*1データサイエンス界に新しい風が吹くのではと期待が高まります。 一方でこのパッケージが何を可能にし、逆に何ができないのかを理解しなければ、雑なデータ分析が増えて逆に有害なのではと思い、今回ブログを書くことにしました。 先に言っておくと、私自身はPythonをメインに使っているわけではありません(使ったことはあるので一応コードを読んで何が起こっているかくらいはわかります)。したがって本記事の目的は、DoWhyライブ
3年前に因果フェスというイベントでGranger因果について専門家でもないのに講演させられるという稀有な経験をしたわけですが。 その時のイベント報告記事で、会場でのディスカッションの内容を踏まえて僕はこんなことを書いたのでした。 非線形Granger因果性検定の手順(ここでは2変量2次ラグモデルを想定する) なる2変量2次ラグモデルを機械学習的なものを含めた何かしらの方法で推定し、その誤差関数をとする。次に、がない(非線形Granger因果を与え得る時系列を伴わない)単変量2次ラグモデル を同様に推定し、その誤差関数をとする。この2つの誤差関数とを表現する学習パラメータを統合する何かしらの情報量規準 を定義し、これの有意性をブートストラップ法などを用いて検定する。 と書き換えて、モデル推定のための何かしら好都合な非線形データに対応可能な機械学習手法(脚注:ここでRNNしか思い付かない自分は
文:Daniel Sim 分析:Lee Shangqian、Daniel Sim、Clarence Ng ここ数ヶ月、シンガポールのMRT環状線では列車が何度も止まるものの、その原因が分からないため、通勤客の大きな混乱や心配の種となっていました。 私も多くの同僚と同じように環状線を使ってワンノースのオフィスに通っています。そのため、11月5日に列車が止まる原因を調査する依頼がチームに来た時は、ためらうことなく業務に携わることを志願しました。 鉄道運営会社SMRTと陸上交通庁(LTA)による事前調査から、いくつかの電車の信号を消失させる信号の干渉があり、それがインシデントを引き起こすことが既に分かっていました。信号が消失すると列車の安全機能である緊急ブレーキが作動するため、不規則に電車が止まる原因となります。 しかし8月に初めて発生した今回のインシデントは、不規則に起こっているように見えるた
このコラムについて 「統計学」と聞くと、難しい数式とグラフを思い浮かべ、抵抗感を持っている人が多いでしょう。とくに文科系の人であればその思いは強いはず。でも、一度、統計学の視点で世の中を見渡してみると、物事は大きく違って見えてきます。数学が苦手だった人でも吉田教授の“講義”なら大丈夫。難しいことはありません。経営とビジネス、そして人生に役立つ統計学です。 記事一覧 記事一覧 2013年6月27日 規制緩和が変えてしまった日本型資本主義 規制緩和の英国はどうなった?日本は? 英国ではサッチャー政権の時、規制緩和を推し進めた。その結果、半分以上の企業が外資系企業となり、2008年の世界同時金融危機の時ダメージを受けた。裕福な人たちは国外に脱出し今では1400万人が貧困にあえ... 2013年5月8日 違和感あり!日本の「国民幸福度」は正しいのか? “幸せランク”はイギリス12位、日本が21位
東日本大地震・震災による直接的な広告費(額面)のへの影響は、数字の上ではほぼ終息。そして現在では震災以前からの広告業界・メディアの流れ「4マス(新聞、雑誌、ラジオ、テレビ)が苦境に陥っている」「デジタル系、屋外広告などの非4マス系の一部が堅調」的状況がそのまま継続する動きが見受けられる。 3月の特徴としては、全般的に大きなプラスへの動きが確認できる。これは一年前の記事で解説している通り、昨年同月が東日本大地震・震災によって大きなマイナス値を示したのが原因。それとの比較のため、リバウンドで大きくプラスに振れた感が強い。例えば2011年3月分では4マス中「新聞」が一番大きな減少ぶりを示していたため、今回はその反動で一番大きな上昇値を算出している。 参考値として電通における、「一昨年前の値」との比較を算出したのが次のグラフ。基準値を設定してその値に「前年における前年同月比」「今件の前年同月比」を
先日【減るCD購入、増えるヘビーレンタルユーザー…CDの購入・レンタル性向をグラフ化してみる】でレンタルCDの動向について触れたが、その際に以前の記事、レコード・CDレンタル店舗数をグラフ化し精査する記事を調べる機会があった。今件につき、日本レコード協会にて最新データが【CDレンタル店調査 2011年度】として掲載されているのが確認できた。今回はこのデータを基に、2011年度(2011年6月末調査(原則))におけるCDレンタル店の動向をグラフ化・記事データの更新を行うことにした。
持ち直すミリオン、シングルは5本・アルバムも4本…CDやネット配信の「ミリオン”認定”」動向(2012年発表) 日本レコード協会は2012年3月29日、「日本のレコード産業2012」を発表した(【発表リリース】)。同協会調査による2011年のレコード・音楽産業の概要を網羅した資料であり、音楽業界の動向を多方面から確認できる、貴重な資料といえる。今回はこの資料のデータの中から、CDやネット配信の「ミリオン”認定”」をグラフ化して精査した記事を更新する形で、「ミリオン認定」のグラフを生成することにした。 雑誌やゲームソフト市場でも使われている言い回しとしても知られ、作家・出版元にとっては夢の一つでもある「ミリオンセラー」(100万本以上売れることを意味する)。以前の記事では1989年以降2009年までのデータをグラフ化したが、今世紀に入ってからミリオンセラーは急減し、2009年にいたってはシン
はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、
Google is adding a slew of new updates for Maps, including a few AI-powered features that are designed to make it easier for users to search, explore their surroundings and get to their destinations. Credal.ai, a Y Combinator-backed startup that gives enterprises a way to connect their internal data to text-generating, cloud-hosted AI models, has raised $4.8 million in a seed round led by Spark Ca
Technologies Overview Select one of the technologies listed on the left to get the survey on the technology usage statistics. Methodology When interpreting our surveys, you should know the following: We include only relevant websites in our surveys. A website is relevant if it has some meaningful content or functionality. We use content analysis as well as the linking structure among websites to d
人が病院以外で亡くなり、明らかに病死でない場合「変死体」と呼ばれ、警察が犯罪によるものか判断している。 ここで「変死体」と呼んでいるのは、正しくは「異状死体」である。厳密な意味での「変死体」は、「異状死体」のうち、犯罪によるものと判断された「犯罪死体」と犯罪によるものではないと判断された「非犯罪死体」(事故死、自殺等多くを占める)を除き、いずれかの判断がつかないものを指す。「異状死体」は、まず、警察のスクリーニングによって、「犯罪死体」「変死体」「非犯罪死体」の3種に分けられ、さらに「変死体」について医師の立ち会いの下に検視、あるいは検視後の司法解剖が行われ、犯罪との関わりの有無が再度判断される(中根憲一「わが国の検死制度」レファレンス、2007.2)。 変死体(異状死体)の都道府県別の報告数を図録とした。この情報は、大相撲の力士急死事件と捜査のための解剖との関係を解説した東京新聞の記事か
ひと目でわかる貧富の差…壁のある世界地図が話題に 世界の貧富の差は大きくなる一方で、持てる者はさらに持ち、持たない者はさらに搾取されていく構図が存在しています。 グローバル化が進んだとは言え日本を含む先進国はその他の国より恵まれ、守られた壁があると言っても過言ではないでしょう。 そんな「壁の世界」と題された世界地図が話題を集めていました。 「壁の世界」 ※画像クリックで拡大 この地図によると壁の中と壁の外で人々が分けられています。 壁の中の人々は14%の人口で、世界の73%の収入を得ています。 壁の外の人々は86%の人口で、世界の27%の収入を得ています。 黄色い○:生活水準の高い都市トップ50 赤線:ガードのきつい境界線 漠然と知っていることでも数字で見るとその差は歴然で、いろいろ考えさせられます。 この地図に対する、海外サイトのコメントを抜粋してご紹介します。 ・そしてその壁の中の世界
日本の財務省やマスコミ、評論家、それに政治家などは、好んで「国の借金」という用語を使用する。その割に、彼らはバランスシート(貸借対照表)について全く理解していないわけだから、実際、困ったものである。 借金とは「人から借り入れた財産」を意味し、バランスシートの負債項目に計上されるべきものだ。「国の借金! 国の借金!」などと騒ぎ立てるのであれば、常識としてバランスシートについて理解していなければならないはずだが、現実はどうも違うようだ。 誰かの負債は、誰かの資産 今回は、まずは2つの「原則」をご紹介したい。 1つ目は「この世の誰も覆せない絶対原則」。資産と負債の関係についてである。 ◆原則1:誰かの負債は、誰かの資産。誰かの資産は、誰かの負債 誰かがお金を借りているのであれば、誰かが貸している。誰かが貸してくれない限り、誰もお金を借りることはできない。当たり前である。 ところが、マスコミなどで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く