タグ

データマイニングに関するhiru926のブックマーク (8)

  • 31データクレンジング方法

    データマイニングでは、データが膨大となっている場合があります。ここまでデータ量が大きくなると計算量の問題で解析時間がかかりすぎるという問題が起き、色々なデータマイニング技法を試行することができません。 それでは、大規模データに対抗するためにどうしたらいいでしょう?  今、著者が思いついたものを挙げてみると 1.高速なマシンに期待する 2.大規模でも計算する手法を編み出す 3.仮説を立てて絞り込んで挑戦 4.サンプリングして、そこそこの量のデータで試す 5.それでもじっくり処理が終わるのを待つ ということをとりあえず思いつきました。(他にある場合は教えてください) それでは、以上の項目をデータマイニングとして検討してみましょう。 【1番:高速なマシンに期待する】高速マシンに投資することは基的に有効です。30年前の計算機ではどうやっても不可能であった計算処理であっても技術

  • ノート/マイニング/バスケット解析をRで - 東邦大学理学部情報科学科 山内のサイト

    サイトトップ ノート マイニング ├マイニング ├バスケット解析 ├バスケット解析をRで ├図書貸出をRで └ テキストマイニング ├テキストマイニングTM ├TMとシソーラス ├PubMedをTM ├TMとMeSH ├TMとNLTK ├テキストマイニングとtagger ├医薬品添付文書DB ├論文の処理1 └ 分子進化学 ├分子進化学 └ Pythonと論文アクセス ├Pythonを使ってみる ├PythonPubMedPythonで...続き └ CUDA ├GPUProgrammingGuide ├Selandメモ ├数値積分 └ ACS、PHPからLDAP ├ACS導入 ├新規ホスト移行 ├再度やり直し ├OpenLDAP導入 └ Linuxでビデオ ├Linuxでビデオデータを作る ├AVIフ

  • Java APIの概要

    6 Java APIの概要 この章では、Oracle Data Miningの新しいJava APIについて説明します。Java APIを使用すると、Oracle Database内で優れたデータ・マイニング機能にアクセスするシン・クライアント・アプリケーションを作成できます。 ODM Java APIは、データ・マイニング用のJava Data Mining(JDM)1.0標準のOracle実装です。ODM Java APIは、JSR-73標準拡張フレームワークに準拠したJDM 1.0に対するOracle固有の拡張機能を実装しています。データベースで利用できるデータ・マイニングの全般的な機能およびアルゴリズム(DBMS_PREDICTIVE_ANALYTICS PL/SQLパッケージの新しい予測分析機能を含む)は、ODM Java APIを通じて公開されます。 ODM Java API

  • RFM分析(あーるえふえむぶんせき)

    RFM analysis / recency, frequency, monetary analysis 顧客の購買行動・購買履歴から、優良顧客のセグメンテーションなどを行う顧客分析手法の1つ。データベースマーケティングにおいては、顧客データ分析の最も基的なものであり、アナリティカルCRMシステムなどに機能として実装されていることも多い。 まず、顧客1人1人に関して次の3つの観点から指標化する。 R(recency:最新購買日) いつ買ったか、最近購入しているか F(frequency:累計購買回数) どのくらいの頻度で買っているか M(monetary:累計購買金額) いくら使っているか この各指標の数値に重み付けした上で合算してランキングを作成すると、その上位の顧客は“最近、何度も、たくさん買ってくれている顧客”、すなわち優良顧客と判断するということになる。各指標の重要性や意味合いは

    RFM分析(あーるえふえむぶんせき)
  • アップセル(あっぷせる)

    ある商品の購入者または購入希望者に対して、購入あるいは買い替え・契約更新時に、その商品と同種でより上級(販売単価や利益率の高い)のものを提案することで、顧客単価の向上を目指す販売アプローチ。 例えば、ハワイへの旅行を考えている顧客に「結婚記念日なら一流ホテルに泊まりませんか」「空港からの送迎をリムジンにすれば快適です」というように、高付加価値のプランを推奨する方法である。すなわち価格面ではなく、付加価値の面で納得してもらうことが必要である。 アップセルで重要なのは顧客の“納得”と“満足”であり、その場限りの利益を追求して強引な販売をすれば、顧客は「高いものを買わされた」と感じて、結果的には離れていってしまう。最終的に顧客に納得・満足してもらえる提案を行うことで、顧客との長期的な関係を形成し、顧客生涯価値の最大化を図るようにすることが大切だといえる。 店舗や訪問販売以外にも、コールセンターや

    アップセル(あっぷせる)
  • クロスセル ― @IT情報マネジメント用語事典

    ある商品の購入者または購入希望者に対して、その商品に関連する別の商品あるいは組み合わせ商品などを推奨することで、顧客当たり購買品目数の向上を目指す販売アプローチ。 関連商品を含め提案を行うことで、顧客にとっては必要になりそうなもの、欲しい商品やテーマを知ることができ、販売側としては売り上げが上がるメリットがある。 例えば、PCを購入しようとしている顧客にはデジタルライフを想定して、メモリ、プリンタ、デジタルカメラなど、PC関連商品を同時に推奨する方法である。身近な場面では、ハンバーガーショップでハンバーガーを頼むと「ポテトもいかがですか」と勧められるのもクロスセルだ。 ハンバーガーショップの例は単純なものだが、一般にクロスセルを実現するためには、顧客のし好性やライフスタイル、購買履歴などの情報と豊富な商品知識が必要である。 こうした情報・知識は顧客との長期の関係や経験がものをいうが、それら

    クロスセル ― @IT情報マネジメント用語事典
  • マーケットバスケット分析(まーけっとばすけっとぶんせき)

    データマイニングの利用法の1つで、POSデータやECサイトのトランザクション(取引)データを分析して、“一緒に買われる商品”の組み合わせを発見する探索的データ分析のこと。 1顧客による1回の取引データをマーケットバスケット・データといい、これを週や月単位に集計した取引データベースをソースとしてデータマイニングを行う。量販小売業で特に有効とされるが、クレジットカードの取引データや通信系会社の利用記録などに適用することもできる。 一般にアソシエーション分析の手法が利用され、結果は[パン, バター]→[ミルク]というようなアソシエーション・ルールの形で出力される。 「おむつを買う顧客は同時にビールも買う」という“おむつとビール”の事例が有名。このほか、「日曜大工店でラテックスペンキを購入する人の8割はローラーを同時購入する」「品店でトルティーヤチップスを購入する人の8割は瓶入りサルサソースを同

    マーケットバスケット分析(まーけっとばすけっとぶんせき)
  • アソシエーション分析(あそしえーしょんぶんせき)

    POSデータ(注1)などの巨大なデータベースから、価値あるアソシエーション・ルール(注2)を抽出するデータマイニング(注3)・テクニック。マーケットバスケット分析(注4)に利用される。 アソシエーション・ルール抽出(association rule extraction)、アソシエーション・ルール・マイニング(association rule mining)、アソシエーション・ルール発見(association rule discovery)などともいう。 小売業のPOSシステムでは、日々大量のトランザクションデータが生み出されている。この中には、「パンとバターを購入した取引の90%がミルクも購入している」といった法則が秘められているが、中規模の小売店舗でも商品アイテム数は数千から数万に及び、その組み合わせ(アソシエーション・ルール)は無数にある。そのため、どの組み合わせが価値ある法則であ

  • 1