タグ

統計学に関するmemoyashiのブックマーク (4)

  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • 実践的な統計学を勉強するには?

    Aができれば、おのずとBもできます。CはAを学んでいくうえで自然と学ぶことになります。 時間短縮ということに重点を置くのであれば、まず代表的な検定の例題を一通りコンピュータで行ってみることですかねぇ。多変量解析についても同じように、とにかく教科書を真似てみることが良いと思います。 そうやっていくと、「この数値は何の意味があるの?」とか「こういうときはどの検定を使えばよかったっけか?」、「あれ、こういうデータはたしか変数変換しなければいけなかったはず?」という疑問が出てきます。そういう時点で、理論的な説明を読んで勉強していけば良いでしょう。 もともと独学というのは、"穴"ができるものですが、そういうのはどんどん色んな手法を試していくうちに補われていくものです。なにより「仕事がありますのであまり時間はかけられません。」というように、確率論からやっていたらいくら時間があっても足りませんからね(^

    実践的な統計学を勉強するには?
  • R で学ぶ『涙なしの統計学

    ロウントリー著『涙なしの統計学』 統計の基礎を理解するのに有用なでテキストである『涙なしの統計学』に出てくる例題を R を用いて分析してみます。エクセルを使っても分析できますが、R でも分析してみると理解がさらに深まるでしょう。 以下の説明では、データを R Consoleに直接入力するか、あるいは、タブで区切られたテキストデータを R Consoleに読み込む方法で説明していきます。 ヒストグラム 脈拍データの読み込み R Consoleでタブ区切りのテキストデータを read.table() を用いて読み込みます。コマンドプロンプトに対して、以下のように入力します。タブ区切りテキスト形式で保存した、ファイル「myakuhaku.txt」を「myakuhaku」変数に読み込んでいます。読み込みに当たって、作業ディレクトリの変更を忘れずにしておきましょう。 > myakuhaku <

  • 1