[B! python][モデル] deejayrokaのブックマーク

deejayroka id:deejayroka

pythonとモデルに関するdeejayrokaのブックマーク (8)

プロでもよくある線形回帰モデルの間違い - Qiita
最近、データサイエンスが流行っていることもあり、線形回帰モデルについても解説記事を見かけることが多くなりました。情報にアクセスしやすくなったのはいいことだと思うんですが、ずっと以前から間違いや解説の不足が多い理論なので、私なりに解説を試みたいと思います。全体的にあまり厳密ではありませんが、線形回帰モデルを学びたての方には有益な記事になるかなと思います。あと、私も勉強中の身なので、間違いがあったらご指摘いただけたら嬉しいです。本題さて、よくある間違いとは以下のような解説です。線形性の仮定が満たされていないので、線形回帰モデルを使ってはいけない残差が正規分布&等分散ではないので、線形回帰モデルを使ってはいけない回帰係数に対するt検定の結果をもとに、p値が大きい説明変数を除外する多重共線性があるとよくないので、変数間で相関が強い、もしくはVIF値が大きい変数を除外する AICが小さ
deejayroka 2023/01/10
"「多重共線性 = 悪いもの」と捉え、考えなしに変数を除外するのは間違いです。交絡因子として必要なのかどうか、背後の関係を考えて慎重に意思決定する必要があります"

あとで読む

python

qiita

データ

モデル

web

統計

データサイエンス
リンク
Python: Optuna で機械学習モデルのハイパーパラメータを選ぶ - CUBE SUGAR CONTAINER
今回は、ハイパーパラメータを最適化するフレームワークの一つである Optuna を使ってみる。このフレームワークは国内企業の Preferred Networks が開発の主体となっていて、ほんの数日前にオープンソースになったばかり。ハイパーパラメータ自動最適化ツール「Optuna」公開 | Preferred Research 先に使ってみた印象について話してしまうと、基本は Hyperopt にかなり近いと感じた。実際のところ、使っているアルゴリズムの基本は変わらないし、定義できるパラメータの種類もほとんど同じになっている。おそらく Hyperopt を使ったことがある人なら、すぐにでも Optuna に切り替えることができると思う。その上で Hyperopt との違いについて感じたのは二点。まず、Define-by-run という特性によって複雑なパラメータを構成しやすく
deejayroka 2019/01/20
学習

モデル

python

Optuna

機械学習
リンク
Python: ベイズ最適化で機械学習モデルのハイパーパラメータを選ぶ - CUBE SUGAR CONTAINER
機械学習モデルにおいて、人間によるチューニングが必要なパラメータをハイパーパラメータと呼ぶ。ハイパーパラメータをチューニングするやり方は色々とある。例えば、良さそうなパラメータの組み合わせを全て試すグリッドサーチや、無作為に試すランダムサーチなど。今回は、それとはちょっと違ったベイズ最適化というやり方を試してみる。ベイズ最適化では、過去の試行結果から次に何処を調べれば良いかを確率分布と獲得関数にもとづいて決める。これにより、比較的少ない試行回数でより優れたハイパーパラメータが選べるとされる。 Python でベイズ最適化をするためのパッケージとしては Bayesian Optimization や skopt、GPyOpt などがある。今回は、その中でも Bayesian Optimization を使ってみることにした。使った環境は次の通り。 $ sw_vers Produ
deejayroka 2018/11/14
ベイズ最適化

python

学習

モデル

機械学習

machinelearning

ai

ベイズ
リンク
Pythonによる時系列分析の基礎 | Logics of Blue
Pythonを使った時系列解析の方法について説明します。時系列データの読み込みから、図示、自己相関などの統計量の計算といった基礎から始めて、自動SARIMAモデル推定までを説明します。この記事を読めば、簡単なBox-Jenkins法についてはPythonで実装する方法が身につくかと思います。 JupyterNotebookでの実行結果はリンク先から確認できます。目次時系列分析とは時系列データの読み込み時系列データの取り扱い自己相関係数の推定 ARIMAモデルの推定 SARIMAモデルの推定総当たり法によるSARIMAモデル次数の決定 1．時系列分析とは時系列分析とは、その名の通り、時系列データを解析する手法です。時系列データとは、例えば「毎日の売り上げデータ」や「日々の気温のデータ」、「月ごとの飛行機乗客数」など、毎日（あるいは毎週・毎月・毎年）増えていくデータのことで
deejayroka 2018/08/23
python

モデル

データ

予測

*機械学習
リンク
L1／L2正則化に関して調べたメモ - kimiakimのブログ
機械学習を勉強しているとよく目にするL1／L2について、いろいろ調べたものをメモ程度に。分類や回帰分析では、学習データとモデル値の誤差を最小化することでモデル化を行うが、過学習を避けるためにペナルティ項を加える。そのペナルティを加えることで、重み付けベクトル（e.g. 2次元：w1, w2）の値が取れる範囲に条件をつけられ、過学習を防ぐ。わかりやすい絵は「パターン認識と機械学習（出版：シュプリンガー・ジャパン株式会社）」に載っているのでご参考まで。 d.hatena.ne.jp L1ノルム正則化項のように定義され、w1, w2は原点を中心とした四角の領域を取る。このとき、四角の領域に接するようにしないといけなく、自ずとw1=0となる。 Lasso回帰とも呼ばれる。 < 特徴 > L1正則化は重み付け要素w1=0となるため、「不要なパラメータを削りたい」という時によく使われる。（次
deejayroka 2017/11/09
モデル

データ

python
リンク
基本的なRecurrent Neural Networkモデルを実装してみた - Qiita
Recurrent Neural Network（再帰型ニューラルネット）に関心はあるが，なかなかコード作成に手がつかない，このようなケースが多くないだろうか？理由はいくつかあるが，私の場合は次のようなものが思い当たる．単純にネットワークの構成が複雑．MLP(Multi-layer Perceptron)から入門してCNN(Convolutional-NN)に進むまでは，特殊なLayerがあるにせよ，信号の流れは順方向のみであった．（誤差の計算は除く．） MLPやCNNにおいては分かりやすい例題，（Deep Learningの’Hello World'と称される）"MNIST" があったが，そのような標準的な(スタンダードな）例題がRNNにはない．因みにTheanoのDeep LearningやTensorFlowのTutorialは，言語モデルを扱ったものである．言語モデルに精通され
deejayroka 2017/08/21
あとで読む

rnn

モデル

deep learning

python
リンク
そのモデル、過学習してるの？未学習なの？と困ったら - once upon a time,
移転しました。 https://chezo.uno/post/2016-05-29-sonomoderu-guo-xue-xi-siteruno-wei-xue-xi-nano-tokun-tutara/
deejayroka 2017/08/15
あとで読む

モデル

メディア

データ

python
リンク
建站成功
您的请求在Web服务器中没有找到对应的站点！可能原因：您没有将此域名或IP绑定到对应站点! 配置文件未生效! 如何解决：检查是否已经绑定到对应站点，若确认已绑定，请尝试重载Web服务；检查端口是否正确；若您使用了CDN产品，请尝试清除CDN缓存；普通网站访客，请联系网站管理员；
deejayroka 2017/08/03
あとで読む

チュートリアル

TensorFlow

モデル

グラフ

プレースホルダ

Python

ドロップアウト

ニューラルネットワー

セッション
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx