タグ

2018年4月25日のブックマーク (6件)

  • scikit-learn でトレーニングデータとテストデータを作成する

    ページでは、Python機械学習ライブラリの scikit-learn を用いてトレーニングデータとテストデータを作成するために、サンプリングを行なう手順を紹介します。 トレーニングデータ・テストデータとは 教師あり機械学習(回帰分析、決定木分析、ランダムフォレスト法、ナイーブベイズ法、ニューラルネットワークなど)によるモデルを作成するには、準備したデータセットをトレーニングデータ(訓練用データ、学習用データとも呼ばれます)とテストデータ(検証用データ、評価用データ、検証用データとも呼ばれます)の 2 つに分割して予測モデルの作成、評価を行なうことが一般的です。このように一定の割合でトレーニングデータとテストデータに分割することをホールドアウト (hold-out) と呼びます。 以下は、クレジットカードの解約予測の分析テーマを例に挙げて、そのイメージを説明します。 トレーニングデー

    hsato2011
    hsato2011 2018/04/25
  • Python scikit-learnのSVMで糖尿病データセットを分類する - け日記

    ピマ・インディアンの糖尿病のデータセットを使って、SVMで糖尿病か否かを分類します。 合わせて、欠測値の補完や、SVMに欠かせないデータの標準化、グリッドサーチによるハイパーパラメータの探索も行っています。 ピマ・インディアンの糖尿病データセット 今回はピマ・インディアンの糖尿病データセットを使います。 糖尿病のデータセットとしては、scikit-learn付属のもの(sklearn.datasets.load_diabetes)も書籍等でよく見かけますが、それとは別でUCI(カリフォルニア大学アーバイン校)から提供されており、実際にサンプルされたデータです。 ピマ・インディアンの女性の症例768サンプル(内糖尿病と診断されたのは268サンプル)で、各サンプルは8つの計測値(年齢、妊娠回数、BMIなど)と1つの診断結果(糖尿病か否か)の値を持ちます。 UCI Machine Learnin

    Python scikit-learnのSVMで糖尿病データセットを分類する - け日記
  • scikit-learnでsvm 基本的な使い方 - 備忘録とか日常とか

    今更だがsvmを使いたかったのでscikit-learnで使い方を調べた。 公式ドキュメントが整っているのでそっち見ただけでもわかる。 1.4. Support Vector Machines — scikit-learn 0.19.2 documentation 以下参考 Scikit-learnでハイパーパラメータのグリッドサーチ scikit-learnによる多クラスSVM 2013.07.15 はじパタlt scikit-learnで始める機械学習 とりあえず使う とりあえず使うというだけなら何も考えず from sklearn import svm clf = svm.SVC() clf.fit(train_features, train_labels) とすれば識別器の学習ができる。 その後テストデータに対して推定を行うには test_pred = clf.predict

    hsato2011
    hsato2011 2018/04/25
  • Chainerのソースを解析。LSTM クラスと時系列処理 | コード7区

    Chainer に LSTM というクラスがあります。名前が示すとおり、RNN(再帰型ニューラルネット)の LSTM(長・短期記憶)を実現するためのクラスで、自然言語処理の公式サンプル ptb などで使用されています。 ソースを追ってみます。バージョンは 1.14.0 、2016年9月5日時点のソースです。

  • http://arxiv.org/pdf/1703.03664

    hsato2011
    hsato2011 2018/04/25
  • Pixel Recursive Super Resolution

    We present a pixel recursive super resolution model that synthesizes realistic details into images while enhancing their resolution. A low resolution image may correspond to multiple plausible high resolution images, thus modeling the super resolution process with a pixel independent conditional model often results in averaging different details--hence blurry edges. By contrast, our model is able

    hsato2011
    hsato2011 2018/04/25