先月号では、相関ルール抽出に関して架空のデータを用いて説明した。その続きとして、リアルのデータを用いて説明をする。 パッケージarulesの中には幾つかのリアルのデータセットが用意されている。その中の1つがデータセットIncomeである。データセットIncomeは、サンフランシスコベイエリアの、あるショッピングモールの顧客9409人が回答したアンケート結果のデータ(IncomeESL)の中から、欠損値を含んでいるものを取り除き、整理したものである。データIncomeESLは表3に示す14項目に対する回答結果である。表の中のデータのタイプの「順序」は順序尺度、「名義」は名義尺度を指す。表3の変数の数は合計84である。データIncomeの中の、順序尺度は調整されているので表3とは異なる。例えば、表3の「収入」項目の変数の数は9になっているが、データIncomeでは2つ($0-$40,000,