エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
外れ値の影響で回帰直線の結論が真逆になる話 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
外れ値の影響で回帰直線の結論が真逆になる話 - Qiita
ニュースとかでよくありますよね。散布図が描いてあって、回帰直線が描いてあって、「相関がある」とか... ニュースとかでよくありますよね。散布図が描いてあって、回帰直線が描いてあって、「相関がある」とか「○○なほど〇〇であることが分かった」とか解説してるやつ。 ここでは、データの一部(ここでは「外れ値」と呼ぶことにします)を取り除くだけで「正の相関」「負の相関」が逆転するケースを、人為的に作ってみたいと思います。そしてそれが、データサイズを変えるとどう影響するのかをみてみたいと思います。 Optuna で最適化 はい、いつものように(?)Optunaで最適化したいと思います。 import numpy as np from sklearn.linear_model import LinearRegression # Optuna の目的関数 class Objective: def __init__(self, n_data=10, n_outlier=1): self.X = [] self