タグ

2016年3月10日のブックマーク (4件)

  • Why P=0.05?

  • pythonでマルチコア並列処理をする方法 - Qiita

    def function(hoge): #やりたいこと return x def multi(n): p = Pool(10) #最大プロセス数:10 result = p.map(function, range(n)) return result def main(): data = multi(20) for i in data: print i main() この場合だと、「0,1,2・・・19と値を変化させてfunctionを20回実行する」という処理になります。 functionの返値はresultにリストで入っているので、受け取って標準出力しています。 また、私の環境では12コア(正確には6コア12スレッド)まで使えるので最大プロセス数は10としました。 最大まで使うとブラウザを開くのも一苦労になるのでやめておいた方が無難です。 CPU使用率 並列処理中のCPU使用率も載せてお

    pythonでマルチコア並列処理をする方法 - Qiita
  • scikit-learnを用いたサンプルデータ生成 - データ分析がしたい

    機械学習の勉強や新しいアルゴリズムのテストをする場合、irisなどのシステム組み込みのサンプルデータを利用するか、UCIリポジトリなどのネット上の公開データから良さげなものを探すというのが一般的だと思います。 しかしながら、irisなどの組み込みデータは一般にデータ数が少なく、分類問題として物足りなかったり、ネット上の公開データを利用するにしても適当なデータ数や特徴量数、問題設定や難度のデータを探すのが難しいですし、前処理が必要なデータも多く手軽に使えるサンプルデータとなると中々見つけられないといったことがあるかと思います。 そういった場合、適当なデータ数や難しさのデータを自分で生成して利用すると、後の計算コスト評価や機械学習アルゴリズムの理解において色々と便利です。 サンプルデータの作り方としては、何らかの統計モデルに基づいて作る方法もありますが、データの質にこだわらないのであればsci

    scikit-learnを用いたサンプルデータ生成 - データ分析がしたい
  • Python: Iris データセットをサポートベクターマシンで分類してみる

    以前実装した単純パーセプトロンは線型分離可能な問題しか解けなかった。 それに対し、サポートベクターマシン (以下 SVM) はカーネル関数を用いることで線型分離不可能な問題も解けるようになっている。 また、単純パーセプトロンでは異なるクラスタを分離するための線がクラスタのギリギリに配置されることも多かったが、SVM ではそのマージンが最大になるようにできている。 今回は SVM を自分で書くのではなく scikit-learn のそれを使った。 $ pip install scikit-learn scipy matplotlib 以下のサンプルコードでは Iris データセットの Petal length と Petal width を元に Setosa と Versicolor の二品種を分類している。 #!/usr/bin/env python # -*- coding: utf-8

    Python: Iris データセットをサポートベクターマシンで分類してみる