タグ

統計に関するmapk0yのブックマーク (23)

  • GitHub - mckinsey/vizro: Vizro is a toolkit for creating modular data visualization applications.

    Rapidly self-serve the assembly of customized dashboards in minutes - without the need for advanced coding or design experience - to create flexible and scalable, Python enabled data visualization applications Use a few lines of simple configuration to create complex dashboards, which are automatically assembled utilizing libraries such as Plotly and Dash, with inbuilt coding and design best pract

    GitHub - mckinsey/vizro: Vizro is a toolkit for creating modular data visualization applications.
  • 【Python 入門】Prophet を使った時系列データ分析と Plotly による可視化!

    こんにちは、機械学習の講師をしている木下です! ビックデータ自体の今、時系列データが多く取得できるようになっています。しかし、時系列データは分析・可視化・解釈が難しく、多くの人の頭を悩ませています。 多くの人が用いているのが、Prophet という非常に便利なライブラリです!Prophet を用いると簡単に分析できるのですが、その後の解釈や可視化の難しさはまだ課題として残っています。 ここでは、そんな時に便利なライブラリ plotly について Google Colaboratory を用いて初学者向けに解説していきます。

  • UbieでのBI民主化の振り返り

    こんにちは。Ubie Discoveryのおきゆきです。アナリティクスエンジニア/データアナリストとして働いています。自己紹介ページはこちらです。 Ubieでは、各チームが適切にデータを利活用できるようにするためのBI民主化活動を行っています。この記事では、昨年行ったBI民主化の取り組みの一部を紹介します。 BI民主化が必要なわけ データチームが依頼の窓口となり、各チームの依頼に対応するというやり方は、ナレッジが独人化しがちで、チケット管理などの運用コストが増し、中長期的にみてもデータチームの生産性が低下しがちです。結果、質的なデータ基盤改善や攻めの分析活動が後手になりやすいです。また、ドメインに詳しい依頼元が分析実施できたほうが良い示唆を得られることが多々あります。 一方、データチームを介さずに各チームで分析の実施までできている以下のケースではどうでしょうか。 「あるデータが欲しいプロ

    UbieでのBI民主化の振り返り
  • 勃起ペニスの長さが30年間で24%も増加していると判明! - ナゾロジー

    勃起ペニスの長さが30年間で24%も増加していると判明! / Credit:Canva . ナゾロジー編集部「精子の数が年々低下している」というニュースを聞いたことがある人は多いでしょう。 恐ろしいことに、これは事実です。 男性の生殖にかかわるデータによると、53カ国に住む5万7000人の男性の精子を調べたところ、過去46年間で1mlあたりの精子数が1億400万個から4900万個に、実に50%以上(年率にすると1.2%)減少していたことが報告されています。 さらに精子の減少速度は加速しており、2000年から2018年までの毎年の減少率は2.6%にも及んで切ることが示されました。 受精に必要な精子は1つです。 しかし、膣から子宮への旅を乗り切れる精子は極めて少なく、子供をつくるには1mlあたり4000万個の濃さが必要とされています。 このしきい値を下回る場合、それだけ自然な受精は困難になって

    勃起ペニスの長さが30年間で24%も増加していると判明! - ナゾロジー
  • 「一発、裏ドラ、赤は麻雀を運ゲーにしたのか?」......の話の前に、まず「運ゲー」とか「競技性」とかって何やねんって話|あでのい

    「一発、裏ドラ、赤は麻雀を運ゲーにしたのか?」......の話の前に、まず「運ゲー」とか「競技性」とかって何やねんって話 皆さん、麻雀打ってますか? 「Yes」と答えてくれた方々の大部分は、おそらく赤有りルールで麻雀を打っていることでしょう。 巷の雀荘のフリールールで赤の入ってない店とか今どき皆無に等しいでしょうし、人気ネット麻雀の雀魂、天鳳でも段位戦は赤有りオンリーです。天鳳も昔は赤無し卓があったように記憶していますが、いつの間にか無くなってますね。 今どき赤無しルールで麻雀が打たれているのは仲間内のセットかプロ団体による競技麻雀か、客層がご年配に偏ってる健康麻雀ぐらいでしょう。 で、なんですけど、麻雀やってると定期的に議論になるお話として「赤有り麻雀とか運ゲーじゃん」ってのがありますよね。皆さんも一度は触れたことがあるのでは無いでしょうか? 実際に人と議論したことは無くっても、麻雀打ち

    「一発、裏ドラ、赤は麻雀を運ゲーにしたのか?」......の話の前に、まず「運ゲー」とか「競技性」とかって何やねんって話|あでのい
  • テキストエディタで使われがちなデータ構造 Piece Table の概要と実装 - A Memorandum

    テキストエディタのデータ構造 Gap method Piece Table method Piece Table の構造 Piece Table の実装 Piece Table のメソッド まとめ テキストエディタのデータ構造 テキストエディタで採用されているデータ構造にはいろいろあります。 こちらの論文 Data Structures for Text Sequences では各種データ構造について比較検討されています。 多くは、Gap method や Piece table method をベースにしたものが多いのではないでしょうか(図で言う最下部の中心の丸印に当たります)。最近では Rope なども有名ですね。 Gap method Gap method では、現在のカーソル位置で、テキストバッファを2つに分割し Gap を間に挟み、カーソル位置に対する編集(テキスト追加/削除)を

    テキストエディタで使われがちなデータ構造 Piece Table の概要と実装 - A Memorandum
  • 今こそ「ソノタノミクス」に注目せよ - モノシリンの3分でまとめるモノシリ話

    国交省が統計不正が発覚して大問題になっている。経緯や問題点についてはこの朝日新聞のまとめ記事を見るとよい。新たな情報に合わせて随時更新されるという。 www.asahi.com 調査票の原票を消しゴムで消し、鉛筆で書き換えていたというのだから驚きである。生データを変えてしまっているため、復元もできない。年間1万件ほど行われていたそうである。 なお、これについては私も朝日新聞から取材を受けてちょっとコメントしている。 www.asahi.com そして、以前毎月勤労統計で不正をやらかした厚生労働省は、またも不正をしていたことが発覚した。 nordot.app こんなニュースが続くので、「日政府は統計をいじくることなどしない」など、もう誰も思っていないだろう。 そこで、この機会に私が拙著で繰り返し指摘している「ソノタノミクス」について、改めて注目していただきたい。 この問題こそが、丸である

    今こそ「ソノタノミクス」に注目せよ - モノシリンの3分でまとめるモノシリ話
  • ア㊙️イさんのお尻 on Twitter: "政治家や官僚といった公務員の汚職事件は市民の猛烈な批判と激烈な怒りを買う訳だけど、そうした汚職事件の余波が意外な形——スーパーの万引きの増加——で社会に悪影響を与える事を明らかにした研究があるのだ。 (1/16) https://t.co/2269quWPb2"

    政治家や官僚といった公務員の汚職事件は市民の猛烈な批判と激烈な怒りを買う訳だけど、そうした汚職事件の余波が意外な形——スーパーの万引きの増加——で社会に悪影響を与える事を明らかにした研究があるのだ。 (1/16) https://t.co/2269quWPb2

    ア㊙️イさんのお尻 on Twitter: "政治家や官僚といった公務員の汚職事件は市民の猛烈な批判と激烈な怒りを買う訳だけど、そうした汚職事件の余波が意外な形——スーパーの万引きの増加——で社会に悪影響を与える事を明らかにした研究があるのだ。 (1/16) https://t.co/2269quWPb2"
  • <独自>奈文研の年輪年代法データ「不開示は不当」 市民団体が提訴へ

    遺跡や建築物に用いられた木材の年輪幅から伐採年を特定する「年輪年代法」をめぐり、日でこの測定法を確立した奈良文化財研究所(奈文研、奈良市)が、年輪幅の基礎データの開示を求めた市民団体の情報公開請求に対し、調査研究への支障を理由に不開示としていたことが23日、関係者への取材で分かった。 測定法の確立からはすでに30年以上が経過しており、団体側は「研究に支障が生じるとは考えられない」として、近く不開示決定の取り消しを求め、提訴する方針。 年輪年代法は、奈文研の前身である奈良国立文化財研究所の光谷(みつたに)拓実氏が昭和55年に研究に着手。ヒノキについて、紀元前から約2千年分の年ごとの年輪幅が分かる「暦年標準パターン」を平成2年までに確立。その後、範囲を広げ、現在ではヒノキとスギの約3千年分の年代を測定できるようになっている。 団体が開示を求めたのは採取した木材の年輪を撮影した画像や年輪幅の計

    <独自>奈文研の年輪年代法データ「不開示は不当」 市民団体が提訴へ
  • Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita

    こんにちは、Exploratoryの白戸です。 Appleは新型コロナウイルスの対策支援として、Appleマップでの経路検索をもとにした移動傾向のデータを公開しています。ところが、残念ながらこのデータはそのままでは簡単に可視化できるようなフォーマットになっておらず、ちょっとした加工を行う必要があります。 しかし逆に、加工の仕方さえわかってしまえばそれぞれの都市や地域の移動データを可視化することで、恐怖を煽るばかりのマスコミからは見えてこない現状を理解することができるようになります。 今回はこのAppleの移動傾向データを簡単に可視化できるようにするための基的な加工方法を、みなさんと共有させていただければと思います。 データはこちらからダウンロードすることができます。 以下は「モダンでシンプルなUIを使ってデータサイエンスができる」Exploratoryを使って、「日で最も自粛している都

    Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita
  • データ分析のための統計学入門.pdf

  • 高層階の住人に多い心臓停止死、25階以上は生存率ゼロ|あなたの健康百科|Medical Tribune

    2016年02月02日 06:00 素晴らしい眺望で人気のタワーマンションだが、良いことばかりではないようだ。カナダの研究グループは、マンションの高層階に住む人は低層階に住む人に比べ、心筋梗塞などで心臓が止まった後に生き延びる割合が低いとする研究結果を、1月18日発行のカナダ医師会誌「CMAJ」(電子版)に報告した。心停止で病院に運ばれ、生きて退院できた割合は、1~2階の4.2%に対して16階以上で0.9%、25階以上ではゼロだったという。 救急到着が遅れがち 人口密度の高い都市部を中心に、高層マンションが次々と建設されているのは日だけではない。この調査が実施されたカナダでも建設が進み、トロント市では2006年から2011年にかけて高層マンションの住民が13%増えたという。 研究グループは、2007~12年にトロント市などで、心停止で病院に運ばれた8,216人を対象に調査した。 その結果

    高層階の住人に多い心臓停止死、25階以上は生存率ゼロ|あなたの健康百科|Medical Tribune
  • 国内の死亡1万4000人減 1~10月、コロナ対策影響か - 日本経済新聞

    1~10月の日の死亡数は前年同期より1万4千人少ないことが厚生労働省の人口動態統計(速報)で分かった。新型コロナウイルス対策で他の感染症の死亡が激減した影響とみられるが、新型コロナの死亡数は抑制できていない。専門家は「さらなる警戒が必要だ」と強調する。厚労省は10月までの人口動態統計の速報などから毎年12月下旬に年間推計を公表している。今年は「例年と動向が異なる」として推計を見送った。11月

    国内の死亡1万4000人減 1~10月、コロナ対策影響か - 日本経済新聞
  • 9割の人が知らない再現性の危機 - 本しゃぶり

    で読んだ知識をドヤ顔で紹介したら、その実験には再現性がありませんでした。 そんな恥ずかしい記事を書いたブロガーは誰でしょう? そう、私です。 ステレオタイプ脅威はありますん ちょっと前に「ステレオタイプ脅威」の記事が話題になっていた*1。 世の中には「女性は数学に弱い」というような負のステレオタイプがある。自分のアイデンティティがそれに該当していると意識してしまうと、実際にパフォーマンスが落ちるというものだ。これは様々な実験の結果によって示されている。というのが記事で紹介されていた話だった。 ところが現在、その「実験結果」は再現性が無いと言われている。ステレオタイプ脅威の根拠は実験結果にあるというのに、その土台は不確かなものであるのだ。 とくに、最近の研究ではほとんど再現性がないとされている「ステレオタイプ脅威」について、リベラルバイアスにも言及しながら議論しているのが印象的。 日では

    9割の人が知らない再現性の危機 - 本しゃぶり
  • 志村けんのパラドックス - アスペ日記

    みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。— 森岡正博 (@Sukuitohananika) 2020年3月25日 このツイートと、 森岡正博 on Twitter: "みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。" ブコメがひどい。水曜日のダウンタウンとやらによれば志村けんは日の知名度ランキング15位。そんな人が感染してるなら、実際

    志村けんのパラドックス - アスペ日記
  • データから真実を見抜くために抑えたい『因果推論』の基本 - ゆとりずむ

    こんにちは、らくからちゃです。 原価コンサルタント見習として、コスト・マネジメントのお手伝いをさせて頂いております。売上が増えても、製品を作るのに高い材料が必要だったり、工程が複雑で人件費が掛かるようだと利益には繋がりませんよね?そこで製品ごとに製造コストを計算して『いくらなら利益が出るのか?』『いま一番儲かっている製品はどれか?』といったことを分かりやすくお伝えするシステムの導入を支援させて頂いております。 お客様に『このコストは、この実績に連動して増減するから、これを基準に按分して...』なんてヒアリングをしながら設定作業を進めていくのですが、当にその考え方で良いのかなあなんて思うことはよくあります。そんなモヤモヤした気持ちを抱えながら屋さんに行った所、なかなか面白いを発見いたしました。 「原因と結果」の経済学―――データから真実を見抜く思考法[Kindle版] posted w

    データから真実を見抜くために抑えたい『因果推論』の基本 - ゆとりずむ
  • 子宮頸がんワクチンにまつわる計算間違い - shinzorの日記

    【5/29追記】 はてブコメントで間違いの指摘がありましたので,訂正の記事を書きました。そちらもご覧いください。記事は自らの計算間違いの見としてそのまま残しておきます。当ブログのテーマの一つは「錯覚」ということもあります。 「率」の扱い − 「子宮頸がんワクチンにまつわる計算間違い」の訂正 http://d.hatena.ne.jp/shinzor/20160529/1464480070 ********************************* 日だけのようですが,子宮頸がんワクチンには賛否両論が渦巻いています。両論を見てみると,賛と否で全く違うデータを示している場合があります。意見,見解の相違というレベルではなくて,単純に数字が違うのです。「羅生門」の世界ではないので,確実に,どちらかが間違っているか,あるいは両方間違っていることになります。 具体的な意見として,少し古い

    子宮頸がんワクチンにまつわる計算間違い - shinzorの日記
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
  • 人類は少子高齢化しました - A Successful Failure

    2015年11月26日 人類は少子高齢化しました Tweet TEDにおける伝説的なプレゼンの一つにHans RoslingによるStats that reshape your worldviewがある。1000万回以上も視聴されたプレゼンなので見たことがある方も多いだろう。彼はTrendalyzerという自作のソフトを用いて、統計データを視覚化し世界の様相を伝えている。 Trendalyzerはここで配布されている。また、後にTrendalyzerはGoogleに買収され、Google Visualization APIとして配布されている。さらに、様々な長期的統計データもここに整理・集約されている。 彼は2006年に行われたプレゼンにおいて、先進国は長寿で少家族、発展途上国は短命で大家族という先入観は今や正しくなく、世界全体が少子化・長寿化に向かっていることを示した。次のVizは彼が示

    人類は少子高齢化しました - A Successful Failure
  • 厚生労働省:平成22年度 「出生に関する統計」の概況

    1 婚姻・出生の推移 (1) 出生の年次推移 合計特殊出生率は、平成18年以降緩やかに上昇している。 出生数の年次推移をみると、第2次世界大戦前は概ね増加していた。戦後は、終戦直後の繰り延べられた結婚による昭和22~24年の「第1次ベビーブーム」期(ピーク時の24年には270万人)と、その時期に生まれた女性による46~49年の「第2次ベビーブーム」期(ピーク時の48年には209万人)の2つの山がみられた後は減少傾向にあり、平成3~12年は増加と減少を繰り返していたが、13年からは5年連続減少し、18年以降は再び増加と減少を繰り返している。(図1) 一方、合計特殊出生率は、「第1次ベビーブーム」期には4を超えていたが、昭和25年以降急激に低下し、31年には2.22となり、人口置換水準(同年2.24)を初めて下回った。その後、41年の「ひのえうま」前後の特殊な動きを除けば緩やかな上昇傾向となり