確率変数の期待値は、確率変数がとる値とその値をとる確率の積を全て足し合わせたもので、確率変数の平均値を表します。期待値は分布の特徴を掴むために用いられる情報の一つであり、Expectation(期待)の頭文字の「」を用いて表します。例えば、確率変数の期待値は「」と表します。 ■離散型確率変数の場合 離散型確率変数の期待値の場合の期待値は、確率変数がとり得るそれぞれの値に対応する確率を掛け、掛けた結果を全て足し合わせることで算出できます。
確率変数の期待値は、確率変数がとる値とその値をとる確率の積を全て足し合わせたもので、確率変数の平均値を表します。期待値は分布の特徴を掴むために用いられる情報の一つであり、Expectation(期待)の頭文字の「」を用いて表します。例えば、確率変数の期待値は「」と表します。 ■離散型確率変数の場合 離散型確率変数の期待値の場合の期待値は、確率変数がとり得るそれぞれの値に対応する確率を掛け、掛けた結果を全て足し合わせることで算出できます。
ビジネスパーソンとしてキャリアを積まれている方は、きっとプレゼンテーションを行う機会が多いでしょう。 プレゼンに欠かすことのできないのがスライド資料。社内会議・社外コンペ・採用イベントと、利用シーンはさまざまですよね。しかし、見やすくスマートなスライド資料の作成にてこずることも多いのではないでしょうか? そこで今回はネット上で100万PV(ページ・ビュー)を誇るサイト"【プレゼン】見やすいプレゼン資料の作り方【初心者用】"を参考に、まずは基本となるポイントから紹介していきます。 ※各画像は参照サイトより引用しています。
意外と使ってない?! 癖になるPythonの内包表記を使ってみよう 「他のプログラミング言語になくて、Python特有の面白い言語機能は?」と聞かれて、最初に思いつくのは「リストの内包表記(英語: list comprehensions)」だろう。この内包表記というのは、手軽にリストを生成する便利な機能だ。しかし、他のプログラミング言語ではなかなかお目にかかれない機能なので、それほど使ったことがないという人も多いだろう。そこで、今回は、基本に返って、Pythonの内包表記について、フォーカスしてみよう。 基本的な使い方 まずは、内包表記の基本的な使い方を見てみよう。そもそも、たくさんの値を一つの変数で管理できるのがリストだ。そして、内容表記を使えば、そのリストを手軽に初期化できる。ここで、0が100個入ったリストを作成してみよう。以下のように記述する。 [0 for i in range(
「データ分析の力 因果関係に迫る思考法」を読んで、データ分析の課題はどこにあるのか、理解できたことをメモ。 ロジカルでないラフなメモ書き。 初心者の妄想なので、間違っていたら後で直す。 【参考】 データ分析の面白さはどこにあるのか: プログラマの思索 【1】データ分析の課題はどこにあるのか? 僕の感想では、現時点におけるデータ分析の課題は、次の3つがあると思う。 ・データ分析から得られる結論の再現性はあるのか? ・データ分析したい研究者は、自由にデータを収集できる環境にあるか? ・得られた因果関係はマクロレベルだけでなく、個人というミクロレベルでも正しいのか? 【1-1】データ分析から得られる結論の再現性はあるのか? 最近のパワフルな環境で、いくらデータ分析できたとしても、その結果に再現性がなければ無意味。 間違った前提条件でデータをこねくり回しても、その検定処理が有意であるか、とはすぐに
Redash? RedashとはさまざまなデータソースからSQLなどのクエリを駆使してデータを取り出し、グラフやレポートをGUIで作ることのできるオープンソースのツールです。 Webエンジニアをされていれば、いい感じにデータを抽出してほしいという依頼が飛んできたりすることもあるのではないでしょうか? Redashでは実行したクエリを保存して別の人が違うタイミングで実行したり、ダッシュボードにまとめてレポートを作ったりすることができるので、その辺の要求に簡単に応えられるようになるのではないかと思います。 Redashハンズオン? この記事のタイトルにもありますRedashハンズオンはid:kakku22 さんが作られているもので、ハンズオン中で使うデータを含め環境構築まですべてが書かれています。 MacでもWindowsでも問題なくできるそうなのでこれも嬉しいなと思いました。 動機 どのくら
(2018/6/12追記) 本講座(第3回)は2017年2月6日をもって受付を終了しました。 現在、第4回(2018年6月12日開講)の受講登録を受け付けております。 こちらのページをご参照ください。 この度、『社会人のためのデータサイエンス演習』の開講に先立ち、活用編となる『誰でも使える統計オープンデータ』を特別開講しております。 オープンデータである統計データを活用したデータサイエンスをわかりやすく解説しており、『社会人のためのデータサイエンス演習』と併せて学習していただくことで、より活用の幅が広がるかと思います。この機会に、ぜひご受講ください。 ※特別開講のため、修了証の発行はございません。 講座内容 総務省統計局が提供する講座第2弾、ビジネスの現場で求められているデータサイエンスをわかりやすく解説します。 今、ビジネスの現場では、統計的な思考力によって様々な課題を解決していく能力、
今回はツイッターからツイートデータを取得し、それをWordCloudというライブラリを使って可視化してみたいと思います。 Word Cloud関連の記事は、既に多くあり特に目新しいものではないですが、可視化ツールとしてはなかなかインパクトがあるので、テキストマイニング関連の分析の一例として今回やってみました! ちなみに、今回、好きな芸人の中の一人である、スピードワゴン小沢さんのツイートを取得して、可視化してみました。(勝手にごめんなさい。。。) 結果をまず先にお見せします! 今回の流れWord Cloudでは、頻出する単語ほど、つまり特徴的な単語ほど大きな文字で表示されます。右下の「好き」「幸せ」「友達」という言葉がまず目に入りました。 小沢さんのツイートは、とても詩的で素敵です。そんな小沢さんの人柄、芸術性溢れたツイート内容がうまく可視化できているのではないかと思います! さて、この図を
統計検定2級合格のための「問題集・参考書」「合格のための勉強方法」について、まとめました! ※この記事は、統計検定初学者の目線で書かれています。 統計検定2級合格に必要な問題集・参考書 12名の合格者が圧倒的に支持していた問題集3選 第1位 公式過去問題集 第2位 教科書 第3位 初学者向け教科書 合格者体験談(ブログ) 具体的な勉強方法が参考になる 試験傾向の把握・問題の解き方を知るのに役立つ まとめ 統計検定2級合格に必要な問題集・参考書 試験勉強で大切なのは、問題集選び。 (問題集の購入はケチっちゃだめですよ!) 統計検定2級合格者12名の合格体験談を分析し、どの問題集が一番多く使われたのかを集計しました。 ※画像拡大で詳細の確認可能 12名の合格者が圧倒的に支持していた問題集3選 第1位 公式過去問題集 先ずは過去問! 今回、調べた12名のうち、過去問無しで合格した人はいませんでし
(English follows) 我々Team AIは渋谷で毎日機械学習勉強会・データ分析ハッカソンを開催しています。 コミュニティを東京中心の100万人にするのが目標です。 日本中・世界中にこのデータ分析のムーブメントが広がると良いなと思っているので、 データ分析ハッカソンをやるときに便利なチュートリアルをまとめました。 とても楽しいので、皆さん、特に地方の皆さんは是非ご自身でやってみてくださいね! Team AIとしても協力します。 #初めての方は下記でKaggle/特にKernelの使い方をざっと眺めてください まずはこれを観て! 石井が作ったKaggle Kernel機能の解説(生産性が上がります!)=> https://www.youtube.com/watch?v=HkJmnpBjiI0 DataSetが沢山並んでいるここで、いいねが沢山ついている興味あるデータセットをクリッ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く