mahler-5のブックマーク / 2018年7月7日

mahler-5 id:mahler-5

2018年7月7日のブックマーク (4件)

RPubs - RでLDAの一例
Hide Comments (–) Share Hide Toolbars
mahler-5 2018/07/07
LDA

トピックモデル

R
リンク
glmnetで正則化を試してみる - About connecting the dots.
タイトルの通り，よく考えたら今までL1/L2正則化を知識としては知ってるけど，実際に試したことはなかったことに気がついたので試してみましたよという話．L1/L2正則化にの理屈については，TJOさんのエントリとか，unnounnoさんのエントリとかをみてもらえれば良いのではと思います．それより詳しいことが知りたければ，PRMLでも読めば良いのではないでしょうか（適当*1）．まずはデータを眺める使用したデータは，caretパッケージのcarsパッケージです*2．中古車販売のデータっぽくて，価格と，走行距離とか気筒とかドア数とかの車に関するカラムが並んでます．データを読み込んで，可視化して，とりあえず lm() してみます． > library(glmnet) > library(caret) > library(psych) > > # load data > data(cars) > t
mahler-5 2018/07/07
glmnet

R

正規化
リンク
R-Source
回帰分析を行なうために以下の関数が用意されている． lsf it() ：最小二乗法による回帰を行う． lm() ：線形モデルによる回帰を行う glm() ：一般線形モデルによる回帰を行うここで対象となるモデルは以下のような線形モデルである．上式をベクトル表記すると y = Xb + e となる．このときの y は応答ベクトル，X は説明変数のベクトル（モデル行列）で，x0 は切片項（要素が全て 1 である列ベクトル）となっている．回帰分析と重回帰分析関数 lm() により線形モデルの当てはめを行うことが出来る．この関数により，回帰分析や分散分析，そして共分散分析を行うことが出来る．詳しい解説は『工学のためのデータサイエンス入門』(間瀬・神保・鎌倉・金藤共著，数理工学社) を参照のこと．分散分析や非線形回帰についても詳しい解説が載っている．関数 lm() の書式と引数書式
mahler-5 2018/07/07
glm

R

交互作用
リンク
[R] 予測モデルを作るには formula を活用せよ - ill-identified diary
概要 formula オブジェクトは変数変換や交互作用項など, 多彩な表現ができる. xgboost や glmnet では model.matrix() を併用することで formula を利用できる. 統計モデリング/機械学習で予測モデルを構築するとき, 予測性能の向上のため, しばしば変数を入れ替えたり, 変換したりといった推敲が必要となる. R ではこういうときに formula オブジェクトを使うと, いちいちデータフレームに変換後の数値を追加したり書き換えたりする必要がなくなる. glmnet や xgboost など, formula が直接使えないものでも model.matrix() 等を併用すれば可能である*1. formula オブジェクトを解説した記事を探すと, かなり前から存在する. 例えば以下の記事. m884.hateblo.jp なお, 上記はタイトルが「f
mahler-5 2018/07/07
xgboost

あとで読む

predict

R
リンク
- 2018年7月8日
- 2018年7月7日
- 2018年7月4日