Introduction SPMF is an open-source software and data mining library written in Java, specialized in pattern mining (the discovery of patterns in data) . It is distributed under the GPL v3 license. It offers implementations of 254 data mining algorithms for: association rule mining, itemset mining, sequential pattern sequential rule mining, sequence prediction, periodic pattern mining, episode min
ELKI: Environment for Developing KDD-Applications Supported by Index-Structures Quick Summary ELKI is an open source (AGPLv3) data mining software written in Java. The focus of ELKI is research in algorithms, with an emphasis on unsupervised methods in cluster analysis and outlier detection. In order to achieve high performance and scalability, ELKI offers data index structures such as the R*-tree
2013/5/18 "第26回 データマイニング+WEB@東京−オープンデータ活用・ソーシャ ル・アドテクノロジー 祭り−"を開催しました。 第26回 データマイニング+WEB@東京 ( #TokyoWebmining 26th)−オープンデータ活用・ソーシャ ル・アドテクノロジー 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者Twitter List: Twitter List TokyoWebmining 26th 参加者セキココ:第26回 データマイニング+WEB @東京 セキココ (作成してくれた @komiya
Altair® RapidMiner® Data Analytics and AI PlatformRegardless of where your organization is on its data journey, Altair RapidMiner can help overcome the most challenging obstacles in your way. We offer a path to modernization for established data analytics teams as well as a path to automation for teams just getting started. We do this without requiring your organization to radically change your pe
KNIME Analytics Platform 5.3 is now available!Take a look at the new workflow monitor for faster debugging, a multi-purpose data manipulation node with AI assistance, new features to work with the latest GenAI advancements, and more. Visual workflows for complex data & AI work.KNIME workflows allow anyone, whether they’re a business analyst or an experienced data scientist, to harness the latest a
Weka is a collection of machine learning algorithms for data mining tasks. It contains tools for data preparation, classification, regression, clustering, association rules mining, and visualization. Found only on the islands of New Zealand, the Weka is a flightless bird with an inquisitive nature. The name is pronounced like this, and the bird sounds like this. Weka is open source software issued
Orangeは統計の設計をビジュアル的に行うことが出来るソフトウェア。 OrangeはWindows/Mac OSX/Linux用のオープンソース・ソフトウェア。マーケティングやシステムの解析を行う際にはデータを並べ替えたりグルーピングしたりしてそこから何らかの法則を見いだしていく。その結果は表であったりグラフとして現される。 設計画面 数字を眺めているだけでは分からなかった法則がビジュアル化することによって見いだせる可能性がある。そのためには様々な角度から抽出したデータを組み合わせなければならない。その補助となるソフトウェアがOrangeだ。 Orangeはデータを様々な統計的手法および解析を通じて分析し、グラフに表示するソフトウェアだ。面白いのは各解析機能がコンポーネント化されており、ドラッグアンドドロップとインプットとアウトプットを結びつけることで関連性を定義できる点だろう。 コンポ
これからの記事の作成目標を立てるため、これまでの記事を整理した。これまではデータが収集されていることを前提に、それをどう処理するかといった観点から記事を書いてきた。これからは分析手法に加え、そもそもどうやってデータを収集するか、そして分析処理した結果をどう見せるかといった点も深めていきたい。また当然、分析はインテリジェンス活動の手段であって目的ではない。分析を目的化せず、より良い意思決定のツールとするための考察も深めたい。 データ操作と基礎統計 連続変数の基礎統計 散布図の作成 ヒストグラムの作成 Radviz Parallel Coordinates 質的変数の基礎統計 カイ2乗検定と可視化 データ操作Tips(作成予定) 統計解析とデータマイニング事例 回帰分析 回帰分析(ステップワイズ法) 回帰分析(予測値の付与) ロジスティック回帰分析 ポアソン回帰 一般化線形モデル(作成予定
アソシエーション分析(associations analysis)は、百貨店や店舗などで集めている表1のようなトランザクションデータを活用するために、バスケットの中の商品間の関連性について分析を行う方法である。アソシエーション分析は、表1に示すような、トランザクションデータから、頻出するアイテムの組み合わせの規則を漏れなく抽出し、その中から興味深い結果を探し出すことを主な目的とする。 アソシエーション分析は、1990年代初めに英国の有力百貨店マークス&スペンサーの店舗で集めているデータの活用に関して相談を受けたことをきっかけとして、IBM研究所が研究を始め、Apriori(アプリオリ)というアルゴリズムを開発したと言われている。Aprioriアルゴリズムは、巨大なデータベースからアソシエーションルール(associations rules)を抽出することを実現し、データマインニングの実用
「ビールを買ったお客さんはオムツを一緒に買う傾向がある」・・・そんな、小売店のベテラン販売員も予想していなかった、お客様の購買パターンがみえた。。 そんなニュースを耳にしたことはありませんか? <アソシエーション分析>と呼ばれるデータ分析テクニックを使うことで、販売履歴情報(POS情報)の膨大なデータの山から、こうした発見が獲得された、というのが事の真相です。 では、この分析を、お金を一切かけずに、自分の個人PCの上で試しにやってみましょう! インターネットから無料でインストールできる、オープンソフトウェアの「R」というソフトを使って、アソシエーション分析を行うPC画面を紹介します。 金教授が書いた『Rによるデータサイエンス』というデータ・マイニングの入門書(良書!)の280ページ以降の例題を、自分のWindows 7 PCマシン(SONY VAIOラップトップ)で実演しています。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く