〒305-8604 茨城県つくば市観音台3-1-3 独立行政法人 農業環境技術研究所 地球環境部 生態システム研究グループ 環境統計ユニット 研究リーダー あるデータ点が複数の変量から成るとき,われわれは「多変量データ」(multivariate data)と呼ばれるものに遭遇する.たとえば,統計言語Rのパッケージに含まれているデータファイルのひとつに,植物学者 Edgar Anderson が集めた Iris属の形態データがある(ファイル名:「iris」).その一部を下記に示そう:
〒305-8604 茨城県つくば市観音台3-1-3 独立行政法人 農業環境技術研究所 地球環境部 生態システム研究グループ 環境統計ユニット 研究リーダー あるデータ点が複数の変量から成るとき,われわれは「多変量データ」(multivariate data)と呼ばれるものに遭遇する.たとえば,統計言語Rのパッケージに含まれているデータファイルのひとつに,植物学者 Edgar Anderson が集めた Iris属の形態データがある(ファイル名:「iris」).その一部を下記に示そう:
データの中には、多くのトレンド(傾向)が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。 このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。 ことわざで「木を見て森を見ず(You can't see the forest wood for the trees. )」といわれるように、データマイニングの分野ではマクロ(巨視的)な視点で全体を捉える能力が求められます。 とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。 コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。 例をあげて解説します。 左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全
「多変量解析」という言葉を聞いたとたんに「自分は数学が苦手だから」と引いてしまう方も多いようですが、マーケティングで多変量解析を使うという意味においては、数式の理解はまったく必要ないと言っても過言ではありません。それ以上に、多変量解析で何ができるのか、どんな時にどんな手法を使うのが最適なのか、結果をどう解釈するのか、といったことのほうがはるかに重要なのです。多変量解析は万能ではありませんので、パソコンで計算をすれば求める結果が出るというものではありません。よい結果を導くためには入念な設問設計と得られたデータの予備解析が非常に重要で、実はこの部分に一番時間もとられるのです。そしてその結果から自分が何に気づくか、それが最大のポイントです。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く