タグ

アソシエーション分析に関するzmsgnkのブックマーク (5)

  • アソシエーション分析(2)

    先月号では、相関ルール抽出に関して架空のデータを用いて説明した。その続きとして、リアルのデータを用いて説明をする。 パッケージarulesの中には幾つかのリアルのデータセットが用意されている。その中の1つがデータセットIncomeである。データセットIncomeは、サンフランシスコベイエリアの、あるショッピングモールの顧客9409人が回答したアンケート結果のデータ(IncomeESL)の中から、欠損値を含んでいるものを取り除き、整理したものである。データIncomeESLは表3に示す14項目に対する回答結果である。表の中のデータのタイプの「順序」は順序尺度、「名義」は名義尺度を指す。表3の変数の数は合計84である。データIncomeの中の、順序尺度は調整されているので表3とは異なる。例えば、表3の「収入」項目の変数の数は9になっているが、データIncomeでは2つ($0-$40,000,

    アソシエーション分析(2)
  • アソシエーション分析可視化パッケージarulesViz - Analyze IT.

    最近転職して、Rをメインで使用しています。(弊社のR使用率はなんと100%!) 今後も仕事を通じてRの普及と進歩に貢献していきたいと考えています。 今回の記事の更新はRAdventCalendar2012の一貫として更新しています。 ハッシュタグは#RAdventJPですので、こちらもぜひチェックしてみてください。 早くビールが飲みたいので、今日はアソシエーション分析の結果を可視化するパッケージのarulesVizの紹介をしてお茶を濁したいと思います。 アソシエーション分析とはなんぞやとかRでのアソシエーション分析の使い方については、Tokyo.R #22の発表資料が大変よくまとまっていてわかりやすいので、こちらをご覧になってください。これを読めばアソシエーション分析については基を抑えることが出来ると思います。アソシエーション分析について知らない方はこの記事を読む前にこちらをご覧になって

    アソシエーション分析可視化パッケージarulesViz - Analyze IT.
  • R {arules} によるアソシエーション分析をちょっと詳しく <2> - StatsFragments

    こちらの続き。 データの作り方 (承前) 単体の list や data.frame から arules::transactions インスタンスを作る方法は前回まとめた。 加えて、一般のデータでありえそうな 正規化された形を考える。サンプルは コンビニのPOSデータをイメージして、 tran.df: 1 トランザクション ( = 1 売上 )ごとに記録されるマスタ goods.df: 各トランザクションに対して販売された商品を記録するレコード の 2 テーブルからなるデータとする。必要な部分だけ抜き出すと、例えばこんな形。 library(arules) tran.df = data.frame(日時 = paste0('2014-12-22 ', seq(9, 20, 1), ':00'), レジ番号 = rep(1, 12), レシート番号 = seq(1, 12), 年齢層 = r

    R {arules} によるアソシエーション分析をちょっと詳しく <2> - StatsFragments
  • R {arules} によるアソシエーション分析をちょっと詳しく <1> - StatsFragments

    今週は系列パターンマイニング用 R パッケージ {arulesSequences} と格闘していた。使い方にところどころよくわからないポイントがあり、思ったよりも時間がかかってしまった。 関連パッケージである {arules} ともども、ネットには簡単な分析についての情報はあるが、 データの作り方/操作についてはまとまったものがないようだ。とりあえず自分が調べたことをまとめておきたい。2 パッケージで結構なボリュームになるため、全 4 記事分くらいの予定。 概要 まずはパターンマイニングの手法を簡単に整理する。いずれもトランザクションと呼ばれるデータの系列を対象にする。トランザクションとは 1レコード中に複数の要素 (アイテム) を含むもの。例えば、 POSデータ: 1トランザクション = POSレジの売上 1回。アイテムはそのときに売れた個々の商品。 アンケート調査: 1トランザクション

    R {arules} によるアソシエーション分析をちょっと詳しく <1> - StatsFragments
  • R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)

    第41回IBISML研究会 https://www.ieice.org/ken/program/index.php?mode=program&tgs_regid=fcaa63fc93919d63c192941825025f97dfeb046f102fa4fa2c046abe6dc556ce 【講演タイトル】 “機械学習の説明”の信頼性 【講演概要】 機械学習を実社会で利用する上での課題の一つに「機械学習モデルはブラックボックスで説明ができない」点があげられる。このようなモデルのブラックボックス性の問題を解消するために、ここ数年では機械学習モデルの“説明”の研究が活発になされている。しかし、これらの“説明”そのものの信頼性に課題があることが最近の研究で明らかになってきている。講演ではこれら“説明”の信頼性に関する最近の研究について紹介する。

    R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
  • 1