タグ

pythonと統計学に関するthondaのブックマーク (3)

  • 教師なし学習による異常値検知: マハラノビス距離 (理論編) - Qiita

    マハラノビス距離に基づく異常値検知について説明をします. 実装編はこちら これは,教師なし学習により,データのパタンを学習し,このデータから著しく外れたデータを異常値として検出する方法です. マハラノビス距離とは,統計学で用いられる距離を表す手法の1つです. 似た距離の表す手法としてユークリッド距離がありますね. おさらい まずはじめにユークリッド距離の説明をしておさらいをしたいと思います. ユークリッド距離とは,いわゆる「一般的」な距離を表す手法です. ピタゴラスの定理で求められることはご存知だと思います. 簡単に2次元平面で考えると,

    教師なし学習による異常値検知: マハラノビス距離 (理論編) - Qiita
  • ナンバーズ予想で学ぶ統計学

    書は数字選択式宝くじ ナンバーズ の予想方法を研究する人と、統計学を独学したいけど同じ勉強するなら(宝くじという)エキサイティングな要素も欲しいという人に向けた統計解析の解説書です。 統計学を学ぶためにナンバーズのデータを利用し、ナンバーズの予想のためにどのような統計的手法が使えるかを学ぶことができる文書です。 書の目指すところ 統計的手法の使い方を学ぶ。 統計学の理論は無視する(高度な数式を勉強しない)。 統計的手法を使ってナンバーズを予想してみる。 統計学の基礎的な知識を学ぶ。 データマイニングも含む。 ナンバーズの予想に使えないかもしれないけどおもしろそうな予想方法も勉強してみる。 統計解析のソフトウェアは Python と関連ライブラリ ( pandas や SciPy library ) を使用します。 エクセル や Google スプレッドシート 、 R もありますけど個人

  • pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm

    scikit-learn(sklearn)の日語の入門記事があんまりないなーと思って書きました。 どちらかっていうとよく使う機能の紹介的な感じです。 英語が読める方は公式のチュートリアルがおすすめです。 scikit-learnとは? scikit-learnはオープンソースの機械学習ライブラリで、分類や回帰、クラスタリングなどの機能が実装されています。 また様々な評価尺度やクロスバリデーション、パラメータのグリッドサーチなどの痒いところに手が届く機能もあります。 インストール scikit-learnの他にもnumpyとかscipyとかが必要です。 Windows 64 bit版の人は以下のURLに色々なインストーラーがおいてあるのでおすすめ Python Extension Packages for Windows - Christoph Gohlke その他の人は以下のURLを見て

    pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm
  • 1