タグ

統計に関するsumomomimiのブックマーク (70)

  • テレワーク環境の可視化 - sparkgene’s blog

    2020年3月からテレワーク(Work From Home)が始まり、常時同じ部屋にいることも増えたこともあって、いくつかのデバイスを24/7で稼働させることを始めたけど、やりたかったとこまで一旦終わったのでブログにまとめてみました。 現在はこんな感じにモニターの下に置いて使ってます。 室温と湿度の可視化 まず最初にやったのが、M5StickCにFreeRTOSを入れて、DHT11センサーモジュールで室温と湿度を収集し、Raspberry Pi 3上で動いているAWS IoT Greengrass v1(v1.11.0)を経由してAWS IoTにデータを送っている。 IoT Coreで受け取ったデータはRuleの設定で、AWS CloudWatchのメトリックスとして登録され、その情報を使ってダッシュボード機能で可視化した。 ついでにAmazon QuickSightでも見れるようにしたか

    テレワーク環境の可視化 - sparkgene’s blog
  • 『データ分析のための統計学入門』PDFが無料公開 データサイエンティストたちが執筆 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    『データ分析のための統計学入門』PDFが無料公開 データサイエンティストたちが執筆 | Ledge.ai
  • 初学者からの統計学10冊(社会科学向き) - Qiita

    はじめに 千葉大学・株式会社Nospareの川久保です. 今回は,初学者レベルから学部上級レベルの統計学関連の教科書を,順を追って紹介していきます.普段,経済学をはじめとする社会科学(経済学・経営学や政治学など)を学ぶ学生に教えているので,タイトルに「社会科学向き」と入れてみましたが,これから紹介する多くのは,他の応用でも役に立つものが多いはずです. 入門書 大屋幸輔『コア・テキスト統計学』 厳密さと初学者に対する分かりやすさのバランスのとれたです.演習問題を集めた副読もあるので,こちらと併せて学習すると効果的だと思います. 久保川達也・国友直人『統計学』 入門書としては,やや硬派な教科書ですが,しっかり学びたい人にはお勧めの教科書です.「1.記述統計」「2.確率」「3.推測統計」と標準的な構成をしている中,最後の第4部では社会・経済データとして標調査や時系列分析の話題にも触れてい

    初学者からの統計学10冊(社会科学向き) - Qiita
  • なるべく数式を使わない!滋賀大学の無料データサイエンス講座が開講 | Ledge.ai

    画像は『滋賀大学「大学生のためのデータサイエンス(Ⅱ)」講座PV~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では11月16日から、滋賀大学データサイエンス学部による「なるべく数式を使わない」という方針で構成した「大学生のためのデータサイエンス(Ⅱ)」が開講される。受講料は無料。 講座では、機械学習の諸手法とその応用について説明する。まず「機械学習とは何か?」という説明から始め、その後に機械学習の応用事例を紹介。応用事例を先に見ることによって、機械学習の有用性が理解でき、機械学習の手法をより積極的に学べるとしている。 次に、分類問題と回帰問題の具体的な手法を説明し、同時に特徴量の設計・選択など、実践的なテクニックについても紹介する。最後に、近年、発展の著しいニューラルネットワークについても説明してくれる。また、講座は、機械学習の分野のなかでも教

    なるべく数式を使わない!滋賀大学の無料データサイエンス講座が開講 | Ledge.ai
  • 積分とは・対数とは・微分とは〜「分かる」とはどういうことか〜

    文系向け「統計学」の授業で、積分・対数・微分を復習する機会があった。その時の「1枚スライド」を公開した。この図をめぐって、「分かる」とはどういうことか、について多くのコメントをいただいた。それを、まとめました。(話が同時並行で進行するので、スレッド風の「まとめ」です。) 注意:積分は、統計学の場合、正規分布表を見るために必要。対数の必要性は、尤度関数(尤もらしさ)の対数をとって計算を簡単にする式変形で使うため。微分の必要性は、確率密度関数の最大値(尤度最大の条件)を求めるため。どれも統計学で必須の内容。 注意2:(追記8/6)ここに出てくる「指数、対数、微分、積分」は「感染症の数理モデル」の基礎となっている。 注意3:(追記8月9日)番外編『「積分」と「源氏物語」〜「晩年の清少納言」から「京都女子大」まで』へのリンクはこちらです。https://togetter.com/li/157284

    積分とは・対数とは・微分とは〜「分かる」とはどういうことか〜
  • フツーの会社でフツーに働く人にオススメするAI・データサイエンティスト本12選|マスクドアナライズ

    ここ数年「もう終わりだろう」と言われ続けたAIブームは、コロナウイルスによってタピオカ屋を巻き込んでトドメを刺された。自宅作業を「WFH」と呼び、同僚や取引先とはZoomでコミュニケーションを取っている。息抜きにNetflixやYoutubeを見て、「AIは『テレワーク』と『DX』に話題も予算も奪われたな」と思ったりする。だがこれは、IT業界で働く人間の姿だ。 一方で自宅で仕事ができない方々も多く、否応なく出勤する光景は日常となった。仕事から帰って息抜きにテレビをつければ「スーパー派遣社員とAIでリストラ」なドラマや、倍返しの人がITリテラシーとコンプライアンスを無視した銀行で歌舞伎役者による顔芸勝負を見て、「月曜日なんてなければいいのに」と思っている。 つまりIT業界のイキリツイッタラーである我々と、現場で働きながら社会を動かす皆様では、住む世界も見ている光景も異なる。むしろ「当然のよう

    フツーの会社でフツーに働く人にオススメするAI・データサイエンティスト本12選|マスクドアナライズ
  • 500マイル以上離れた場所にメールが送れないのだが

    http://web.mit.edu/jemorris/humor/500-miles From: Trey Harris <trey@sage.org> 今から私が書く話は、起こりようのない問題についてだ。この話を広く一般に公開してしまうのは惜しい。というのも、いい酒の話のネタになるからだ。この物語は、退屈な詳細や問題を隠すために、多少事実を変えていて、物語を面白く脚色している。 数年前、私はキャンパスのメールシステムを保守する仕事をしていて、統計学部の学部長から電話を受けた。 「大学の外にメールを送るのに不具合が発生しているのだが」 「どんな問題でしょう?」と私はたずねた。 「500マイル以上メールを送れないのだよ」と学部長は説明した。 私はラテを吹き出した。「何だって?」 「ここから500マイル以上離れた場所にメールを送信できないのだよ」と学部長は繰り返した。「実際は、もう少しあるの

  • 文系社会人が統計のために1から高校数学をやりなおしました|hanaori

    こういう人間です ・ 文系(英文学科) ・ Webエンジニア ・ 統計を勉強中モチベーションここ2年ほど統計を勉強しているのですが、そこで毎回立ちふさがるのが数学の壁でした。わたしは文系ということもあって数ⅡB(しかも途中まで)しか履修していなかったため、微分積分や線形代数などが出てくると理解することが難しく時間がかかってしまいます。 でももっと統計を知りたいし理解したい 😭 という気持ちをずっと感じていて今回数学をやり直すことにしました。 高校3年分と考えるとなかなか決心するのに時間がかかりましたが、やってよかったと思います。スケジュール感や実際使ったなどを共有することで同じような方の参考になればよいなあ、と思います。 実際使用した ・ 講座■ よくわかる数学シリーズ 主にMY BESTシリーズを使用しました。カラーで説明もわかりやすく、目にも心にもやさしい仕上がりになっております

    文系社会人が統計のために1から高校数学をやりなおしました|hanaori
  • データ視覚化のプロが選ぶデータ分析のオススメ本32選

    データ分析&データ視覚化のコンサルティングをしております、永田ゆかりと申します。 これまで2000人以上の方にデータ分析や活用の研修・トレーニング講師、企業への分析コンサルティングをさせていただいており、仕事をさせていただく中で必要なを読み続けているうちに、気がついたらデータ分析領域のを200冊以上読んでいました。 中でもデータビジュアライゼーション・視覚化の領域に関しては私自身の得意領域ということもあり、数多く読み込んでいます。 記事では数多くのクライアントの方々との問題解決に役立った知識・ノウハウが書かれている良書をご紹介させていただきますので、是非最後までご覧ください。 データ可視化そのものについて知りたいたは、こちらの記事からどうぞ。 データ可視化とは?その重要性や手法、よくある課題と解決策を解説 データ分析における視覚化(ビジュアライゼーション)系のおすすめの17選1 S

    データ視覚化のプロが選ぶデータ分析のオススメ本32選
  • 孫さんがPCR検査を大々的にやるとツイートしたら、多くの方から医療崩壊が起こるというメッセージが来ているようですが、なぜ医療崩壊が起こるんでしょうか?に対するKenn Ejimaさんの回答 - Quora

  • 確率とともに生きる – sociologbook

    新型コロナウィルス、というものが流行っていて、この春はすべてのイベントが中止や延期になり、公的な施設には閉鎖されるところもでてきて、学校も全国で一斉に休校にするかどうかという話があり、そのわりには朝の満員電車はあいかわらずで、それからやっぱりデマもとびかっている。 ドラッグストアやコンビニの店頭からマスクが消え去り、さらにトイレットペーパーがマスクと同じ材料で、もう中国から入ってこなくなるので売り切れるだろうというデマがひろがって、トイレットペーパーも店頭からなくなった。コストコに長蛇の列ができたとか、対応していたドラッグストアの店長がになったとか、そういう記事をたくさん読んだ。 いったい誰がどういう意図で流すのか知らないけど、30度ぐらいのぬるま湯を飲むと熱に弱いコロナが死ぬ、というデマもかなり広がって、さすがにこれは笑った。体温より低いやん。 まあ、しかし笑えない。若年者の致死率は低

  • 機械学習モデルを作成する - Training

    Microsoft Learn では、対話的な方法で、従来の機械学習の概要を理解することができます。 これらのラーニング パスは、ディープ ラーニングのトピックに移行するための優れた基盤にもなり、各自の生産性を向上させます。 最も基的な従来の機械学習モデルから、探索的データ分析やカスタマイジングのアーキテクチャまで、ブラウザーを離れることなく、概念的内容や対話型の Jupyter Notebook を簡単に把握することができます。 知識と興味に応じて自分のパスを選択してください。 オプション 1: 完全なコース: 機械学習のためのデータ サイエンスの基礎 ほとんどのユーザーには、このパスがお勧めです。 これには、概念の理解を最大限に高めるカスタム フローを備えた、他の 2 つのラーニング パスと同じモジュールがすべて含まれています。 基になる概念と、最も一般的な機械学習ツールでモデルを構

    機械学習モデルを作成する - Training
  • えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"

    東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販のを買うよりは,この3… https://t.co/w2cSVIxmUI

    えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"
  • AI時代へ向けて育成すべきはAI人材か?|楠 正憲(デジタル庁統括官)

    今年3月に政府のAI戦略が年間25万人を目標にAI人材を育てるとぶち上げたのに続いて、教育再生会議が全ての大学生がAIなどの基礎的な素養を身につけられるように標準カリキュラムを作成することを提言した。ガートナーが2017年1月に産業界で2020年末時点で30万人以上のIT人材(原典を確認したところAI人材ではなかったようですね)が不足するといったらしいのだが、今からカリキュラムをいじったところで2030年くらいにならないとAIネイティブな新入社員は入ってこないし、その頃まで深層学習が流行っているのか、NVidiaが残ってるのか、PythonやTensorFlowが広く使われているのか、GAFAがどうなっているかなんてさっぱり見当がつかない。 残念ながら私たちは2010年代に深層学習の実用化の局面で米国に負けたのであって、いまから教育をいじるといったって泥棒を捕らえて縄を綯うような話である。

    AI時代へ向けて育成すべきはAI人材か?|楠 正憲(デジタル庁統括官)
  • コインを2000回投げて表が1100回以上出る確率 - Qiita

    Twitterでクイズとして出題してみた問題の解答です。 ★分散についての確率クイズです★ 表と裏が出る確率が同じコインがあります。 このコインを2000回投げたときに、表が1100回以上出る確率はどれくらいでしょうか? 以下の選択肢から最も近い値を選んでください。 — Lillian (@Lily0727K) 2019年5月10日 コイン投げ まずは簡単な場合でコインを4回投げた場合を計算してみます。 表が出る回数 確率

    コインを2000回投げて表が1100回以上出る確率 - Qiita
  • なぜ分散は2乗の和なのか - 小人さんの妄想

    Q.なぜ分散は、単純な差(偏差の絶対値)ではなく、差の2乗を計算するのか? A.分散を最も小さくする点が平均値だから。(単純な差を最も小さくする点は中央値となる。) “分散”というキーワードは統計学の基礎中の基礎であり、どんな教科書にも“平均”の次くらいに載っていることがらです。 しかしながら、いきなり登場する“分散”の意味が分からず、統計学の入り口で挫折する人は少なくありません。 偏差の2乗の平均、つまり、各値と平均との差の2乗の平均を分散といい、 分散の平方根の正の方を標準偏差という。 統計で、ちらばりを表すものとして、標準偏差や分散が多く用いられる。 -- 高校の教科書(啓林館)より. 教科書にはこのように書かれているのですが、これで分かった気になるでしょうか。 ・なぜ、差の2乗を計算するのか? ・差そのものであってはいけないのか? ・なぜ、分散と標準偏差の2種類があるのか? 最後の

    なぜ分散は2乗の和なのか - 小人さんの妄想
  • 簡単だけどとっても重要な計学の話

    ランダムサンプリング(random sampling: 無作為標抽出)とは被験者をある母集団からランダム(無作為)に抽出(サンプリング)するということを意味しており,ランダム割付とは被験者を各要因・各水準に割り当てる操作である。例えば,宮教大の学生(母集団)の生活実態を調べたいときに,全員を調べ上げる(全数調査)ことは大変なので,宮教大の学生の中から無作為に被調査者を選ぶような手法(標調査)がランダムサンプリングとなっている。ただし,調査目的が日の大学生(母集団)の生活実態調査であるならば,上記の標データより示された結果には一般的妥当性の問題が生じる可能性もある(キーワード:世界,母集団,標)。 このような場合は,ランダムサンプリングではなく便宜的なサンプリングと呼ぶべきである。 近代統計学の基的な考えは, 母集団と標を区別することにあるといわれている。 標にもとづいて計算

  • データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly

    今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象がおきるので頭の体操としてとても面白いです。 あまりに有名なパラドックスであるため日語でも解説がいくつか出ていますが、人によって言っていることが違っていたり、不完全であったりします。多くはシンプソンによるオリジナルの論文を読んでないことから起因するのだと思います。 例えばシンプソンのパラドックスを交絡の問題だと捉える人は多いですが、個人的に不完全だと思います(間違いではない)。このように誤解が広まった歴史的背景も含めて、詳しく書いていきたいと思います。ちなみにアニメのシンプソンズはこの問題と全く無関係です。 そもそもシンプソンのパラドックスとは? シンプ

    データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly
  • 「母集団」の意味間違えてる奴多すぎ問題

    わかってますよ風にドヤ顔でブコメつけてるのに間違ってるのは恥ずかし過ぎる bushimichi そもそも新聞社の思惑で誘導尋問しまくってそれを世論調査といってることがねぇ。。。統計の母集団の正当性は固定電話とネットでも大差ない。 netcraft3 層化無作為二段抽出法やRDDが必ずしもベストというわけではないけど母集団の偏りが少ないベターな方法。標調査を理解せず数の多さだけ比較されても意味ない。 famnet 当然。母集団の偏り。数BかCでやらないか?というか、やってなくても常識的にわかるだろ感 https://ja.wikipedia.org/wiki/%E5%81%8F%E3%82%8A 仮に安倍政権に関する世論調査として3000人に調査をしたとする。この3000人を「母集団」だと思ってんだろ?違うよ!それは標だよ! 「母集団」ってのは調査したい集団全体のことだよ!世論調査であれ

    「母集団」の意味間違えてる奴多すぎ問題
  • 統計検定を理解せずに使っている人のために II

    408 化学と生物 Vol. 51, No. 6, 2013 15 μ σ μ σ μ σ 16 セミナー室 研究者のためのわかりやすい統計学-2 統計検定を理解せずに使っている人のために II 池田郁男 東北大学大学院農学研究科 15 16 409 化学と生物 Vol. 51, No. 6, 2013 μ σ σ σ μ σ * 17 μ σ μ σ * μ μ μ Z n 1 1 = − ( ) X µ σ σ 18 μ σ σ σ σ σ μ σ μ μ μ σ / n σ / n σ / n σ / n * * 17 18 σ 410 化学と生物 Vol. 51, No. 6, 2013 t u n 1 1 = − ( ) X µ σ σ σ σ σ μ t X 1 1 = − ( ) µ SE 19 μ μ μ μ μ 20 μ σ μ μ σ μ μ u n / 19 20 4