はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    MacBook Neo

『データの裏側を歩く』

  • 人気
  • 新着
  • すべて
  • 組織の収益成長に貢献するデータ基盤とは?:RevOpsの視点より - データの裏側を歩く

    18 users

    www.medi-08-data-06.work

    データエンジニア、アナリティクスエンジニアが整備するデータ基盤は、ビジネスメンバー、サイエンティスト、アナリストのデータ利活用をスムーズにすることが、 ざっくりとした役割です。 一方で、その役割はビジネスのオペレーションをサポートする側面がつよく、 直接的に組織の収益構造に影響するということは、稀なケースなのではないかと思います。 そんな中で、レベニューオペレーション(RevOps)の概念を知り、 これは、データエンジニアがビジネスで価値を出していくためのヒントになるのでは? と感じたため、今回はレベニューオペレーション(RevOps)の考えにそって、 組織の収益成長に寄与するデータ基盤の役割とは何か を妄想していきたいと思います。 レベニュー部門(Mkt, Sales, CS)が個別に持つデータを統合して、横断分析をすることの価値について、結構なページを割いて書かれています。 データ基盤

    • テクノロジー
    • 2024/11/04 18:45
    • 組織
    • データ
    • マーケティング
    • ビジネス
    • あとで読む
    • そろそろ覚えるRで縦持ち横持ち変換〜pivlot_loger、pivot_wider〜 - データの裏側を歩く

      4 users

      www.medi-08-data-06.work

      Rでテーブルを縦持ち、横持ちに変換したい時、以前は、spreadやgatherという関数がありました。(今もあるのですが、)上記2つに代わって新たに上位互換の関数として登場したのがpivot_longer、pivot_widerです。単純に縦持ち、横持ち変換するだけでなく、列同士の結合や、集計など行うこともできます。 dplyrを使ったその他の前処理方法を知りたい方や、Pyhonで実行したいという方はこちらをご覧ください。 www.medi-08-data-06.work www.medi-08-data-06.work データの作成 まずはデータの作成を行います。作成するデータは、ある架空3店舗の顧客数を日ごとにカウントしたデータです。その日の天気も格納されています。このデータを使って、縦持ち、横持ち変換を行ってみましょう。 # パッケージの読み込み library(tidyverse)

      • 学び
      • 2021/08/25 16:01
      • k-meansとk-means++を視覚的に理解する~Pythonにてスクラッチから~ - データの裏側を歩く

        4 users

        www.medi-08-data-06.work

        k-means(k平均法)は教師なし学習の中でもとても有名なアルゴリズムの一つです。例えば、顧客のデータから顧客を購買傾向によってグループ分けしたり、商品の特性からいくつかのグループに分けたりと使用法は様々です。 そんなk-measですが、実は中学生でも知っている点と点の間の距離を使うだけのアルゴリズムで成り立っているので、簡単に実装することができます。 今回は、k-means とk-meansの弱点を克服したk-means++をPythonを使って実装していきます。 k-meansの仕組み k-meansの問題点とk-means++ クラスの数を決めるエルボー法 scikit-learnを使ったk-meansとk-means++ まとめ 参考 k-meansの仕組み 今回は2つの変数からサンプルをクラスタリングすることを想定してみましょう。グラフはこんな感じになります。 import n

        • テクノロジー
        • 2020/05/03 03:18
        • data
        • Python
        • facebookの時系列予測パッケージ{prophet}を使って、ブログアクセス数を予測する。 - データの裏側を歩く

          4 users

          www.medi-08-data-06.work

          prophetはfacebookが無料で提供している時系列予測パッケージです。RでもPythonでも使うことができます。本家様サイトによると Prophet is a procedure for forecasting time series data based on an additive model where non-linear trends are fit with yearly, weekly, and daily seasonality, plus holiday effects. It works best with time series that have strong seasonal effects and several seasons of historical data. Prophet is robust to missing data and shift

          • テクノロジー
          • 2020/01/24 14:38
          • R の 確率密度関数 ( rnorm, pnorm, qnorm, dnorm ) とは何なのか - データの裏側を歩く

            4 users

            www.medi-08-data-06.work

            統計学を学んでいてRでシミュレーションをしたくなったある日のこと、確率密度関数の使い方がよく分からず困った.... 今回は、確率密度関数の使い方を正規分布を例にまとめてみます!! 正規分布の確率密度 Rの確率密度関数を調べてみると、 rnorm dnorm pnorm qnorm があるようです。 最初の1文字が違うだけで、何が違うんだ!と私は思ったので、一つずつ検証してみました。 まずはdnromから まずはdnormから試してみます。 helpをみると第一引数にquantiles、第二引数にmean、第三引数にsdとあります。第一引数がよく分かりませんが、とりあえず平均0、分散1の標準正規分布で試してみます。 > dnorm(3,mean = 0,sd = 1) [1] 0.004431848 > dnorm(0,mean = 0,sd = 1) [1] 0.3989423 出ました!

            • 学び
            • 2019/12/26 01:14
            • Rでtweetをテキストマイニング:ワードクラウドと共起ネットワーク - データの裏側を歩く

              4 users

              www.medi-08-data-06.work

              テキストマイニング は文字列を対象したデータマイニング手法で、単語の出現頻度、出現タイミングなどを集計する簡単なものから、機械学習を用いてクラス分類する高度なものまで様々な解析手法があります。 今回はそんなテキストマイニング の中でも、単語の出現頻度をわかりやすく可視化するワードクラウドと、どの単語と一緒に出現しやすいかを調べる共起語、それを可視化する共起ネットワークを使って、私自身のtweetを解析したいと思います。 今回は以下の2冊を参考にしています。 Rによるやさしいテキストマイニング 作者:雄一郎, 小林発売日: 2017/02/17メディア: 単行本 Rによるやさしいテキストマイニング [活用事例編] 作者:小林 雄一郎発売日: 2018/10/06メディア: 単行本(ソフトカバー) 下準備 Rで日本語テキストマイニング を行うための有名なパッケージには{RMeCab}があります

              • テクノロジー
              • 2019/12/23 22:30
              • テキストマイニング
              • R
              • 中心極限定理って結局何なのさ - データの裏側を歩く

                3 users

                www.medi-08-data-06.work

                中心極限定理とは、統計学を学び始めると必ずお目にかかる定理なのですが、安直に理解していると大変な勘違いをしてしまう定理です。しかし、いざ理解しようとしても、解説には難解なものも多くイメージしにくいのもまた現状です。今回はそんな中心極限定理について、直感的にわかりやすくイメージしてみます。 森のうさぎの平均体重は何キロ? さて、数式を使っての解説は至るところにありますので、ここでは代わりにうさぎを使って解説していきます。 あなたは動物学者です。ある森の生態調査のために、その森に住むうさぎの平均体重を調べることになりました。 この森には約10万匹のうさぎが生息し、すべてを捕まえることはできないので、とりあえず5匹を捕まえて体重を測ってみました。すると 7kg,、3kg、25kg、6kg、29kg、平均14kgとなりました。 しかし、もっと精確に調査をする必要があるため、5匹を捕まえて平均体重を

                • テクノロジー
                • 2019/12/03 11:38
                • 統計
                • 勉強
                • SHAPを使って機械学習モデルと対話する - データの裏側を歩く

                  3 users

                  www.medi-08-data-06.work

                  機械学習モデルは、統計モデルよりも予測に長けた手法であり、皆様もご存知の通り様々な場面で用いられています。一方で、結果の解釈の面ではブラックボックスになりやすいため、モデルの作成時のみならず、機械学習に覚えのない方々とコミュニュケーションをする上でも重要な課題です。 そんな、機械学習モデルと対話するためのツールがSAHP値(SHapley Additive exPlanation Values)です。SHAPを使うと、機械学習モデルが特徴量をどのように使って予測をしたのか、特徴量は予測結果にどれぐらい影響を与えているのか、などをデータ全体(Global)、さらに個別のサンプルごと(Individual)に確認することができます。今回はSHAPを使って、学習した機械学習モデルと対話してみましょう。 今回は主に以下を参考にしました。 github.com shap.readthedocs.io

                  • テクノロジー
                  • 2019/12/02 14:40
                  • python
                  • リンゴで理解する 尤度 とは~離散確率から正規分布まで~ - データの裏側を歩く

                    4 users

                    www.medi-08-data-06.work

                    統計学を学んでいておそらくつまずくであろう尤度。こいつの正体をリンゴを使ってまとめていきます。 尤度とは? 尤度の何が難しいかと言うとまずはこの漢字。そもそも何と読むかと言うと"ゆうど"と読みます。”尤”なんて日常生活でまず使うことはありません。何でわざわざこんなに難しい漢字を使うんだと初めは愚痴をこぼしたくなりますがそこは我慢します。 尤度の求め方 さて、漢字の読み方が分かったところでこの"ゆうど"とは何かと言うと、どれぐらい起こりやすいかを表す指標になります。例えば以下のような問題を考えてみます。 図のようにA,B,Cの文字が書いてあるリンゴが箱の中に入っています。それぞれ何個ずつ入っているかは分かりませんが全部で30こあることは分かっています。この箱からリンゴを10個取り出した時、Aリンゴが2個、Bのリンゴが5個、Cのリンゴが3個でした。この箱の中には各番号のリンゴがどれぐらいの個数

                    • テクノロジー
                    • 2019/11/15 23:24
                    • 集団全体への介入効果を推定するStandardizationとIPWの実力〜RとPythonにて〜 - データの裏側を歩く

                      3 users

                      www.medi-08-data-06.work

                      前回は因果推論の王道テクニックである傾向スコアを使った回帰分析とマッチングについて紹介しました。今回も傾向スコアを使った解析手法の一つであるIPWと、傾向スコアは使いませんが理論的には同じになるStandardzationの紹介をしていきます。 www.medi-08-data-06.work この二つのモデルは、今まで扱ってきたモデルとは少し違い集団全体の因果効果(Marginal effect)を推定するモデルになります。集団全体の因果効果であるため、交絡因子の層ごとに要因の結果の関係性が異なっていたとしても、効果を推定することができます。 具体的な解析手法のみが気になる方は後半にRとPythonコードをのせてありますので、そちらをご参照ください。 そもそも因果推論ってなんぞ?って方はこちら www.medi-08-data-06.work Marginal effectとCondit

                      • テクノロジー
                      • 2019/05/11 11:10
                      • 因果推論の王道テクニック”傾向スコア”を丁寧に考えてみる~RとPythonにて~ - データの裏側を歩く

                        7 users

                        www.medi-08-data-06.work

                        世の中の事象における真の因果関係は神のみぞが知り、それに抗うために多くの因果推論テクニックが作られてきました。その中でも傾向スコアというのは、ランダム化検証ができない事象でも、データをゴニョゴニョすることで、理論上ランダム化に等しいことができてしまうという夢のようなテクニックです。 www.medi-08-data-06.work 今回はそんな傾向スコアが前提としている仮定や、傾向スコアを使う際の注意点、RとPython使っての解析方法などについて書いていきます。 解析方法を手っ取り早く知りたいという方は後半からご覧ください。 今回のデータ 簡単に回帰分析 CMとプレイ時間の関係に影響を及ぼすのは? 全ての変数を調整することはできない 傾向スコアマッチング マッチング後は分布を確認 マッチングの結果は? 傾向スコアマッチングの注意点(重要) 傾向スコアを変数として使う Rでの実践 Pyth

                        • テクノロジー
                        • 2019/05/05 19:05
                        • あとで読む
                        • ベイズで考える状態空間モデル - データの裏側を歩く

                          4 users

                          www.medi-08-data-06.work

                          古典的な時系列解析のモデルでは、時系列データが定常過程に従うことを前提としていました。しかし、世の中の多くの事象は定常過程に従うことはあまりなく、よりうまく現実を反映させることができるモデルが必要になります。 それが状態空間モデルです。状態空間モデルは今まで紹介してきたARIMAモデルなどの進化版とも言えて、古典的なモデルを含む多くのモデルを一つの概念で捉えることができます。 さらに、他の変数からの影響や周期性なども柔軟に組み込むことができるとても素晴らしいモデルになります。 状態空間モデルの直感的な説明などは多くのサイト様で紹介されているので、今回はベイズ流で状態空間モデルを考えていきたいと思います。 www.medi-08-data-06.work うっかり店長さんの売り上げデータ あるお店の売り上げ100日間のデータを解析することにしましょう。まずは単純なモデルから考えるため、以下の

                          • 学び
                          • 2019/05/01 12:26
                          • あとで読む
                          • 因果推論の基本テクニック、回帰分析は何を意味するのか - データの裏側を歩く

                            3 users

                            www.medi-08-data-06.work

                            因果推論のもっとも基本的なテクニックである回帰分析はよく知られていますが、モデルで仮定している前提や、変数の入れ方によって、結果の解釈が大きく違います。今回は、回帰分析の種類やモデルが意味することを書いてみたいと思います。 何気なく使われる回帰分析も、実はとても奥が深いのです。 因果推論の基本的な考えはこちらをご覧ください。 ちなみに因果推論にも流派がありますが、本ブログではルービンの因果モデルを元にしています。 www.medi-08-data-06.work 因果推論における回帰分析の使い方 回帰分析が意味すること 交絡因子を調整するということ 重回帰分析は万能ではない 交互作用の威力 連続量の扱い方 連続量の解釈 結局回帰分析の意味って? まとめ 参考 Rのコード 因果推論における回帰分析の使い方 まずは、因果推論における一般的な回帰分析を考えてみます。くどいほど使っている広告の有無

                            • 暮らし
                            • 2019/04/21 14:21
                            • 因果推論の基本事項〜広告をみたから商品を買ったのか?それとも....〜 - データの裏側を歩く

                              3 users

                              www.medi-08-data-06.work

                              ビジネスの世界で、ある事象に関する原因と結果の因果関係を推論することはとても重要な要素です。最近では機械学習手法に多くの注目が集まっており、予測さえできればそれで良いと思うかもしれません。 しかし! 原因と結果の関係性を正しく推定し仮説を導くことは、今後重要性を増してくるでしょう。AIブームが一巡しつつありますが、機械学習と因果推論の組みわせに関する研究も出てきているようですので、次にくるのは因果推論ではないかと勝手に思っています。 今回はそんな因果推論に関する基本的な事項を書いていきます。 因果推論の重要性 因果推論の基本事項 交絡因子と見せかけの因果 反事実(Counterfuctual)と根本的問題 無作為化介入と観察データ 観察データが必要な理由 因果推論に必要な前提条件 交換可能性(Exchangeability) 一貫性(Consistency) Positivity まとめ

                              • テクノロジー
                              • 2019/03/30 19:28
                              • じっくり学ぶ時系列解析~見せかけにだまされない編~ - データの裏側を歩く

                                5 users

                                www.medi-08-data-06.work

                                時系列モデルを作るときは、データが定常過程に従っていることを前提とするモデルが多いです。しかし、現実には定常過程に従うデータはあまり多くありません。そんな非定常過程のデータを何となく多変量モデルで解析すると一見ものすごく当てはまりの良いモデルができてしまうことがあります。 今回は、そんな見せかけに騙されないためにも、時系列モデルを作る際に重要な単位根や共和分などの概念ををまとめたいと思います。 書籍等では難しい数式が並びますが、概念自体は直感的にも理解しやすいのです。 単位根とランダムウォーク ADF検定 補足:ADF検定について少し詳しく 単位根はなにが問題か~見せかけの回帰問題~ 補足:見せかけの回帰に騙されない方法 共和分 共和分の検定 Rでの実践 単位根とADF検定 見せかけの回帰 共和分 まとめ 参考書籍 その他 単位根とランダムウォーク 非定常過程というとよく出てくるのが単位根

                                • テクノロジー
                                • 2019/03/29 19:20
                                • 統計
                                • じっくり学ぶ時系列解析~ARIMAの予測と季節調整SARIMA編~ - データの裏側を歩く

                                  3 users

                                  www.medi-08-data-06.work

                                  前回は時系列解析の流れ、そしてARIMAモデルをデータから同定する方法について書きました。 www.medi-08-data-06.work 今回は、ARIMAモデルの予測について、そして単純なARIMAモデルでは説明できない周期性を、季節調整を使ってモデリングする方法について書いていきます。 ARIMAモデルの予測について Rでの実践 季節調整モデル Rでの実践 通常ARIMAでの予測 SARIMAモデル まとめ 参考書籍 その他 ARIMAモデルの予測について ARIMAモデルの予測とはどのようになるのでしょうか。ARIMA過程の差分系列はARMA過程になるので、ここでは簡単なARMA過程の予測を考えてみます。 例えば、こんなARMA(2,1)過程があったとしましょう。 ここで、と与えられている時、一期先の予測値は逐次的に求めることができて、 となります。は誤差の期待値が0であることか

                                  • 世の中
                                  • 2019/03/21 11:17
                                  • じっくり学ぶ時系列解析~基礎編~ - データの裏側を歩く

                                    3 users

                                    www.medi-08-data-06.work

                                    前回は時系列解析の考え方や基本用語についてまとめました。今回はもう一歩進んで、実践に近づいた内容にしていきます。 www.medi-08-data-06.work 今回扱う範囲は、時系列データの前処理方法、AR、MA、ARMA、ARIMAです。それではいきましょう。 時系列解析の概略 データの可視化 定常過程の確認 前処理 対数変換 差分(階差) 対数差分 統計モデルの同定 MA過程(Moving Average process ) AR過程(AutoRegressive process) ARMA・ARIMA過程 モデルの同定 Rでの実践 前処理編 モデル同定編 まとめ 前処理方法 定常過程の特徴 参考書籍 その他 時系列解析の概略 時系列解析は以下のステップで行うのが基本的な流れになります。 データの可視化 まずはデータを可視化します。時系列における可視化は、データがどんな動きをしてい

                                    • 学び
                                    • 2019/03/16 20:52
                                    • じっくり学ぶ時系列解析~準備編~ - データの裏側を歩く

                                      4 users

                                      www.medi-08-data-06.work

                                      時系列データとは、ある一時点ではなく、時間軸に沿ってデータが収集され、変数の並び方にも意味があるデータのことを指します。商品の売り上げを月ごとに集積したデータや、企業の株価データ、気温データ、電車の乗客数などが時系列データの例としてあげられますね。 しかし、世の中の多くのデータが時系列データとして集計されているにも関わらず、これを解析するには通常の線形回帰モデルでは火力不足で、正しい解釈を導き出すことが困難です。 そこで、今回から複数回に分けてそんな時系列データ解析の理論やその実践法についてまとめていきます。 記事中の内容は、Rで再現できるようにコードを記載していくすので、参考にしてみてください。(近々pythonでも再現できるようにいたします。) 時系列分析の目的 時系列データの必要性 いにしえの時系列モデル トレンドモデル 平滑化モデル 時系列モデルのその前に 確率過程(重要) 平均・

                                      • テクノロジー
                                      • 2019/03/12 19:27
                                      • 統計
                                      • マルチレベル分析の基礎〜予測だけでは不満なあなたへ〜 - データの裏側を歩く

                                        4 users

                                        www.medi-08-data-06.work

                                        最近はAIを使った予測が流行っていますが、予測よりも現象を解釈したい場合もあるかと思います。 行った施策に対しての効果を分析したり、事象が起こった後に要因を解釈したり... そんな時に使うのがマルチレベル分析です。現実の仮定を反映しやすく、様々な仮説について解析をすることができます。 今回はそんなマルチレベル分析を導入する必要性や、解析、結果の解釈方法などをまとめていきます! Rでの実行方法は補足として記事中に記載してあるので、参考にしてみてください! マルチレベル分析とは? なぜマルチレベル分析が必要か? マルチレベル分析の適応 ランダム化切片モデル 説明変数の中心化 学校レベルの影響を追加 まとめ 参考 マルチレベル分析とは? マルチレベル分析とは、複数の階層性をもつデータを解析する時に用いられる分析手法です。例えばテストの点数と勉強時間との関連を調べる時に対象となる学校を選び、そこか

                                        • 学び
                                        • 2019/02/11 22:10
                                        • 日付・時刻処理の決定版!lubridateの使い方 - データの裏側を歩く

                                          3 users

                                          www.medi-08-data-06.work

                                          Rで時系列データなどを集計、処理したい場合どうしてますか? Rの基本パッケージにも時系列データを扱うための関数は用意されています。 しかし、これがまたわかりにくい.... POSIXctだの、POSIXltだの、私はなんども調べては忘れ、また調べ、また忘れを繰り返していました。 今回ご紹介する{lubridate}パッケージは、そんな時系列データ処理を簡単に行うことができるパッケージです! {lubridate}に出会った時、いままでの苦悩を優しく慰められたような、そんな気分でした。Rでの時系列処理に困ったときは是非この記事を読んで慰められてください。 {lubridate}とは? 日付・時刻への変換(ymd_hms) 日付・時刻の作成(make_datetime) 日付・時刻の計算(Period,Duration,Interval) Period Duration Interval まと

                                          • 学び
                                          • 2019/02/10 02:06
                                          • モダンな繰り返し処理purrrの使い方 - データの裏側を歩く

                                            25 users

                                            www.medi-08-data-06.work

                                            データの繰り返し処理やapply族を使ったデータフレームの処理などはデータ解析をする上では欠かせませんよね。 そんな時に役に立つのが{purrr}パッケージです。このパッケージは、今までfor-loopさせていた処理や、apply族を使っていた処理をスマートに処理することができます。 慣れるまでに少し時間がかかりますが、使いこなせるようになれば処理の幅が広がることは間違い無いです! 今回はその使い方をまとめていきます。 {purrr}とは map map2,pmap よく使うpurrrの活用法 まとめ 参考 {purrr}とは そもそも{purrr} とは、リストやベクトルを受け取って反復処理をするパッケージです。for文やapply族を使う場合が多いかと思いますが、{purrr}は色々な機能をそなえたモダンなパッケージとなっております。 全部は紹介しきれないので、よく使いそうな関数だけを

                                            • テクノロジー
                                            • 2019/02/01 09:31
                                            • R
                                            • あとで読む
                                            • programming
                                            • 階層ベイズモデルを使ったデータ解析の実践~より複雑なモデルへ~ - データの裏側を歩く

                                              4 users

                                              www.medi-08-data-06.work

                                              前回は階層性のあるデータに対して、線形混合モデルと階層ベイズを用いて解析を行いました。 medi-data.hatenablog.com 今回は、より複雑な階層ベイズモデルに挑戦していきます。前回は扱わなった、新たなデータに対しての予測も行っていきましょう。 今回のお題 階層ベイズの概略 階層ベイズの実践 予測 まとめ NGモデル 参考 今回のお題 前回は、生徒50人のテストの点数と勉強時間のデータを用いて、4つの学校ごとに切片と傾きが異なる(点数と勉強時間の関係性が異なる)データを解析しました。 今回は、3つの都道府県から18の学校を抽出し、そこから生徒450人をサンプリングした仮想データを用います。以下はサンプル抽出のイメージ図です。 つまり、都道県ごと、そして学校ごとでも切片と傾きが異なることを想定しています。 まずは以下を実行してデータセット(st_df)を作成し、グラフ化してみま

                                              • 世の中
                                              • 2019/01/27 15:04
                                              • もっと早く知りたかった高速データフレーム処理~dplyrの使い方~ - データの裏側を歩く

                                                3 users

                                                www.medi-08-data-06.work

                                                Rで扱うことの多いデータフレームですが、みなさんはどのように処理をしているでしょうか? 私は既存の{base}パッケージで処理を行なっていましたが、{dplyr}パッケージを知ってからというもの手放せなくなりました。 この{dplyr}を使うと驚くほど簡単に、そして高速にデータフレーム処理を行うことができます。 今回は既存の{base}パッケージと比較しながら、その実力をまとめてみます。 最後まで読んだあかつきには、あなたもきっと虜になっているはず。 辞書代わりにもどうぞ! count rename select,slice mutate 条件分岐(if_else,recorde,case_when) filter arrange summarise goup_by pivot_wider、pivot_longer エクササイズ まとめ 参考 ちなみにパイプを使った記述で真価を発揮するため

                                                • 暮らし
                                                • 2019/01/21 02:27
                                                • 線形混合モデルと階層ベイズモデルを使ったデータ解析の実践 - データの裏側を歩く

                                                  5 users

                                                  www.medi-08-data-06.work

                                                  前回はベイズ推定を使って単回帰分析を行いました。今回はさらにレベルを上げて階層性のあるデータ解析に挑戦していきます。 medi-data.hatenablog.com www.medi-08-data-06.work 階層性のあるデータの概略から、通常の単回帰、線型混合モデルそして、階層ベイズモデルを用いたモデリングを行います。 それではいきましょう。 階層性のあるデータとは そもそも階層性のあるデータとはどのようなデータでしょうか?前回と同じようにテストの点数を勉強時間から推定する場合を考えてみましょう。 今回のデータは生徒数50人のテストの点数と勉強時間を仮定した擬似データセットです。ただし、今回は4校から生徒をランダムにサンプリングしたと仮定しています。 とりあえず、以下を実行してst_df(student_data_frame)というデータセットを作成してみましょう。 librar

                                                  • テクノロジー
                                                  • 2019/01/20 18:04
                                                  • 統計
                                                  • あとで読む

                                                  このページはまだ
                                                  ブックマークされていません

                                                  このページを最初にブックマークしてみませんか?

                                                  『データの裏側を歩く』の新着エントリーを見る

                                                  キーボードショートカット一覧

                                                  j次のブックマーク

                                                  k前のブックマーク

                                                  lあとで読む

                                                  eコメント一覧を開く

                                                  oページを開く

                                                  はてなブックマーク

                                                  • 総合
                                                  • 一般
                                                  • 世の中
                                                  • 政治と経済
                                                  • 暮らし
                                                  • 学び
                                                  • テクノロジー
                                                  • エンタメ
                                                  • アニメとゲーム
                                                  • おもしろ
                                                  • アプリ・拡張機能
                                                  • 開発ブログ
                                                  • ヘルプ
                                                  • お問い合わせ
                                                  • ガイドライン
                                                  • 利用規約
                                                  • プライバシーポリシー
                                                  • 利用者情報の外部送信について
                                                  • ガイドライン
                                                  • 利用規約
                                                  • プライバシーポリシー
                                                  • 利用者情報の外部送信について

                                                  公式Twitter

                                                  • 公式アカウント
                                                  • ホットエントリー

                                                  はてなのサービス

                                                  • はてなブログ
                                                  • はてなブログPro
                                                  • 人力検索はてな
                                                  • はてなブログ タグ
                                                  • はてなニュース
                                                  • ソレドコ
                                                  • App Storeからダウンロード
                                                  • Google Playで手に入れよう
                                                  Copyright © 2005-2026 Hatena. All Rights Reserved.
                                                  設定を変更しましたx