種々の統計解析手法を用いて大量の企業データを分析し、隠れた関係性や意味を見つけ出す知識発見の手法の総称、またはそのプロセスのこと。「マイニング」は「採掘」の意。データウェアハウスなどに蓄積された膨大なデータを「鉱山」に見立て、そこから未知の知見や規則性という“鉱石”を「発掘する」という意味が込められている。 データマイニングにおける統計・解析アルゴリズムは、相関ルール、クラスタリング、ニューラルネットワーク、遺伝アルゴリズムなど数多くがある。ビジネスの分野では、「決定木分析(ディシジョンツリー)」で顧客特性や傾向を分析したり、「重回帰分析」で過去の実績データから今後の方向性を予測したりといった形で利用される。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名である。 市販のデータマイニングツールにはこうした主要アルゴリズ
![データマイニング(でーたまいにんぐ)](https://cdn-ak-scissors.b.st-hatena.com/image/square/7e51372d18138e90ed2c8d95d693065718b5e361/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fimages%2Flogo%2F1200x630_500x500_enterprise.gif)