サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
買ってよかったもの
www5.ocn.ne.jp/~shinya91
コメント:データマイニングの基本手法をまとめ、論理的背景と事例を解説しています。 自ら解析する人、特にツールを使ってデータマイニングしているけど、根本的に何やっているのか知りたいとか、裏にどんな欠点があるのだろうか と疑問を抱いている人には有効。 以下目次 データマイニング手法の概要 データ解析の歴史から 手法と向いている業務 マーケットバスケット分析 マーケットバスケット分析はどのようなときに有効か マーケットバスケット分析はどのように分析しているのか 基本的な手順 大規模データの問題 分離ルール マーケットバスケット分析を用いた時系列分析 マーケットバスケット分析の長所 マーケットバスケット分析の短所 マーケットバスケット分析適用の場面 記憶ベース推論 記憶ベース推論はどのように動作するのか ケーススタディ:新聞記事の分類 距離の測定 結合関数:近傍に答えを尋ねること 最良の結果を得
もちろん手法はさらに細分化できます。 例えばクラスター分析ひとつとっても、クラスター形成方法(最遠隣法等)や距離関数(ユークリッド距離等)などを選択していく必要がありますし、ビジュアリゼーション(可視化)なんかは、現在でも活発に考案(例えば3次元空間に10次元のグラフを記述)されています。 利用者が明確な目的もなく「データマイニングやってみたい。」と考えると解析に際して,解析者(解析ツール)の専門範囲で知識発見手法を試みるでしょう。 もっともらしい論理と視覚的な結果をつけて「これはデータマイニングじゃないとわからなかったことだ」と主張します。確かにそうなのですが、戦略としてアクションに結び付け、その成果が問われる利用者にとって、果たして本来の目的を満たすものとなるでしょうか? 知識発見の方法は多数あります。解析者が最適な解析手法を選択している保証はありません(ましてや市販されている
[ ] F.A.Q メールでいただいた質問の回答を紹介します。 質問者のプライバシーに触れないように修正しておりますのでその点はご了承ください。 Q.データマイニングとマーケティングの位置付けって? Q.それはデータマイニングじゃない。なぜ? Q.どういった意味で「大規模」であるべきなのでしょうか? Q.○○のデータマイニングツールはどうですか? Q.データベースマーケットとの違いって? Q.エキスパートシステムとの違いは何ですか? Q.ニューラルネットワークの使用法について Q.ニューラルネットワークのツールを使いたい Q.決定木のツールを使いたい Q.ID3とC4.5ってどこが違うの? Q.バスケット分析の手法と実例について Q.データマイニングの動向について Q.属性選択の一般的な手法について Q.費用対効果について。既存の手法との違いについて Q.
データの中には、多くのトレンド(傾向)が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。 このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。 ことわざで「木を見て森を見ず(You can't see the forest wood for the trees. )」といわれるように、データマイニングの分野ではマクロ(巨視的)な視点で全体を捉える能力が求められます。 とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。 コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。 例をあげて解説します。 左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全
※本欄は、著者の見解で分類しております。作成者の意図と異なって紹介している部分もあると思いますがご了承ください。(1)理論・計算方法・学習 著者のページは詳細な計算方法まで記述しておりませんので、計算方法や数学的理論から勉強したい方はここを参考にして下さい。
[ ] データマイニングって何? 「データマイニング」という言葉を初めて聞いた頃(1996年)から現在に至るまでの印象を交えてまとめてみました。 はじめに 誕生の背景 データマイニングの範囲 データマイニングの定義 統計解析といった従来手法とどこが違うの? データから知識獲得までの実際の流れ 近年、蓄積された大量のデータからビジネスに活用できる有用な情報を取り出す技術として「データマイニング」が注目されています。 言葉だけ聞くと「夢のような素晴らしいお話」ですが、現実は泥臭い作業の連続です。また汎用性が低く、常にカスタマイズしながら取り組まなければならず高度な専門知識が必要になります。さらに質の高いデータマイニングを行うため莫大な費用がかかることもあります。そこまでして何故データマイニングに取り組むのでしょう? 本ページでは、その背景を中心に考えてみます。 社会的背景
世の中には、既に分かっている過去のデータがあります。このデータを利用しない手はありません。過去のデータを利用すれば、もし分からない未来のデータが出現した場合、過去のパターンから有効な知識として活用させることができます。 今回、ご紹介するのはそんな過去を知れば未来が見えてくる手法です。概して『パターン認識』と呼ばれる手法とその類です。 「パターン認識」、難しい言葉に聞こえるかもしれませんが、我々は常にパターン認識をしております。 例えば、ある人の顔を見たときに瞬時に記憶の中から誰なのか識別してますし、初めて見る場合でも似たような人物を探しどんな人間なのか当てはめたりすることもできます。 楽しいときはどんな表情をするか、苦しいときはどんな表情をするかという「パターンクラス」を私たちは持っています。初めて会う人の表情でさえ、感情をよみとる能力を持ち合わせています。それがパターン認識です。
データマイニングに関することを、データの集め方から知識の獲得まで、幅広く丁寧に解説しています。データマイニングで用いられる知識発見技術は、バスケット分析・決定木・ニューラルネットワークなど多くの手法があります。だからといって全部を同時に利用することは考えられません。解析手法はそれぞれの役割があり、その目的に合わせて使い分けなければなりません。 それぞれの役割があると書きましたが、大きくわけると2つのタイプがあると思います。「データから本質を探る」タイプと「データから未知の現象を予測する」タイプです。 この章では、「データの洗浄」から「知識発見の方法」を交えて知識発見を考えてみます。
データマイニングでは、データが膨大となっている場合があります。ここまでデータ量が大きくなると計算量の問題で解析時間がかかりすぎるという問題が起き、色々なデータマイニング技法を試行することができません。 それでは、大規模データに対抗するためにどうしたらいいでしょう? 今、著者が思いついたものを挙げてみると 1.高速なマシンに期待する 2.大規模でも計算する手法を編み出す 3.仮説を立てて絞り込んで挑戦 4.サンプリングして、そこそこの量のデータで試す 5.それでもじっくり処理が終わるのを待つ ということをとりあえず思いつきました。(他にある場合は教えてください) それでは、以上の項目をデータマイニングとして検討してみましょう。 【1番:高速なマシンに期待する】高速マシンに投資することは基本的に有効です。30年前の計算機ではどうやっても不可能であった計算処理であっても技術
データマイニングで用いられる知識発見技術は、バスケット分析・決定木・ニューラルネットワークなど多くの手法があります。だからといって全部を同時に利用することは考えられません。解析手法はそれぞれの役割があり、その目的に合わせて使い分けなければなりません。 それぞれの役割があると書きましたが、大きくわけると2つのタイプがあると思います。「データから本質を探る」タイプと「データから未知の現象を予測する」タイプです。 この章では、「データの洗浄」から「知識発見の方法」を交えて知識発見を考えてみます。
[ ] データマイニングツールって。 ここに期待している人が多いと思います。「データマイニングツール」とはどんなものかご紹介いたします。 ・データマイニングツールといっても色々 ・汎用データマイニングツールとは ・VMStudio(汎用マイニングツール)触ってみました 突然ですが、 「データマイニングツール」を使ったことがありますか? ・・・と聞かれると、「あるよ」と自信満々の人、「どういったものがデータマイニングツールなの?」と答える人、「ない」と断言する人、色々な答えが出てくると思います。 データマイニングツールとは「データを加工して意思決定を支援してくれるツール」です。 こう考えてみましょう。決定木のみの機能しかないツールも十分すぎるデータマイニングツールになりますし、Excelのグラフ機能だって広い意味でデータマイニングツールになってしまいます。 そっか、Ex
このページを最初にブックマークしてみませんか?
『www5.ocn.ne.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く