連載2回目は、ネット時代の要請を受けて、データマイニングを取り巻くツール環境がどのように変化(進化)をしているかを、ご紹介させていただきます。 現在、企業内のDWH(データウェアハウス≒巨大なDB)に蓄積された膨大なデータは、例えればダムに貯められた水です。ただ水門を開け閉めするだけでは、膨大な水量(データ量)が流出してしまい、現実的に意思決定の材料としては機能しません。まさに消防ホースから水を飲むようなもので、受け手の処理能力を軽く超えてしまうのです。そこで、処理が可能な適切な量・質に情報を絞り込んで取り出す「蛇口」が必要となり、その機能がデータマイニングに求められています。 しかし、現実問題として、そのマイニング自体が非常に高度で職人的な作業であるため、属人的な制約をうけることになります。つまり、分析者の能力と人数に限界があるため、結果として処理できる件数とデータ量にもすぐに限界が来て
![データマイニングを取り巻くツールに自動化の流れ](https://cdn-ak-scissors.b.st-hatena.com/image/square/5f7a668d4fdcf0010edeece890a5793f25068d15/height=288;version=1;width=512/https%3A%2F%2Fjapan.cnet.com%2Fstorage%2F2010%2F12%2F12%2F2cf5b2bd0e480e21ab4771cc3be6bb71%2Fstory_media%2F20374507%2Fbrainpad_184x138.jpg)