追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ
問題解決の第3ステップでは,まず「どこ」に問題があるかを特定する。さらに「なぜ」そのような問題が発生するか根本原因を探り出す。そのための有力なツールが因果関係図だ。その作成法を中心に解説する。 土井 哲/インヴィニオ 代表取締役 前回まで,問題解決の第1ステップ「問題の認識」,第2ステップ「重要問題の特定」について述べてきた。今回は問題解決において最も重要である,第3ステップ「問題の構造分析」に話を進める。 構造分析とは,問題が発生しているメカニズムを可視化し,問題の本当の原因,すなわち真因を突き止めることである。まずは,構造分析とはどのようなことなのか,システム・インテグレータのSE麻田君は上司の悠木部長に聞いてみた。 「絞り込み」と「深掘り」が大切 麻田:前回の仮説検証作業を通して,顧客のX社の問題が何であるか分かったと思ったのですが,部長はさらに問題の構造を分析すべきだと指摘しました
Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R本体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日本語で書かれている、これまでのRに関する資料の集大成 データの加工技、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く