katz1955のブックマーク - はてなブックマーク

メモリに乗り切れないデータをkerasで学習する - 学習する天然ニューラルネット
はじめに何を使うか方法1 方法2 両者の違い(私感) やることの概要データの説明モデルの構築(飛ばしてOK) HDDからバッチを読み出す訓練結果まとめ追記はじめにこんにちは。何が起きたかから言うと、DeepLearningしようとしたらデータが270GB近くあってメモリに乗らなかった。そこで、練習がてら、batchごとにHDDからデータを読み出して、batch学習するコードを書いた。 kerasやpythonをある程度知っている前提で書き進めていく。何を使うか公式ドキュメントで検索すると"メモリに載らない大きさのデータを扱うには？" FAQ - Keras Documentation とある。これによると方法は2つあるらしい。方法1 model.train_on_batch(x, y)を使う。このブログではこちらを試した。方法2 model.fit_gener
katz1955 2019/03/22
*機械学習
リンク
ランダムフォレストと検定を用いた特徴量選択手法 Boruta - 学習する天然ニューラルネット
特徴量選択とは Borutaとはとりあえず使ってみるベースラインの判別 Borutaの判別 Borutaのアイデアの概要 Borutaのアルゴリズム 1. 判別に寄与しないはずの偽の特徴量を作る。 2. 偽の特徴量と一緒にランダムフォレストを訓練。 3. 各特徴量の重要度と偽の特徴量の特徴量を比較。 4. 複数回比較し検定を行うことで、本当に重要な特徴量のみを選択。検定について 1. 棄却したい帰無仮説と受容したい対立仮説を用意する。 2. 観測値から検定統計量Tを定める。 3. 帰無仮説が正しいとしてTの分布を求める。 4. 十分小さい有意水準αを定め、帰無仮説が正しいときにとなる領域を棄却域とする。 5. 観測されたTがに入っていたら対立仮説を受容し、入っていなければ帰無仮説を受容する。まとめ補足使う際のTips等 2019/01/06追記参考特徴量選択とは特徴量選択
katz1955 2019/01/06
*機械学習
リンク
1

はてなブックマーク

タグ

ブックマーク / aotamasaki.hatenablog.com (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / aotamasaki.hatenablog.com (2)

メモリに乗り切れないデータをkerasで学習する - 学習する天然ニューラルネット

ランダムフォレストと検定を用いた特徴量選択手法 Boruta - 学習する天然ニューラルネット

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス