線形回帰における仮定 前々回、前回 と線形回帰について説明してきました。 線形回帰における最小二乗法では Y 軸の点と点の全体的な長さの差異 (= これを、それぞれの差の二乗を取ってから加算するので二乗誤差といいます) が最小になるように、まっすぐな線 (= 1 次式の直線となる関数) を求めました。すなわち、データの集合から直線に回帰する推定をおこなったわけです。 相関係数を求める どんな 2 次元データでも線形回帰で関数を導くことはできますが、それが妥当かどうか気になります。そこで両者の相関係数を求めます。相関係数はベクトル v1, v2 からそれぞれの要素 x, y の平均を求め、次に v1, v2 の分散と共分散を求めます。コードで表現してみましょう。 def correlation(data): n = len(data) # 二次元データの長さを n に求める xm = 0.0
![線形回帰と相関係数、そして東京の平均気温を実際に分析してみる - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/7ed151a86f97326f228fc71a5bda79463e926355/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUU3JUI3JTlBJUU1JUJEJUEyJUU1JTlCJTlFJUU1JUI4JUIwJUUzJTgxJUE4JUU3JTlCJUI4JUU5JTk2JUEyJUU0JUJGJTgyJUU2JTk1JUIwJUUzJTgwJTgxJUUzJTgxJTlEJUUzJTgxJTk3JUUzJTgxJUE2JUU2JTlEJUIxJUU0JUJBJUFDJUUzJTgxJUFFJUU1JUI5JUIzJUU1JTlEJTg3JUU2JUIwJTk3JUU2JUI4JUE5JUUzJTgyJTkyJUU1JUFFJTlGJUU5JTlBJTlCJUUzJTgxJUFCJUU1JTg4JTg2JUU2JTlFJTkwJUUzJTgxJTk3JUUzJTgxJUE2JUUzJTgxJUJGJUUzJTgyJThCJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz02ZDEwZDRhNTcyMWQ0YTMzYjkyMTIwNmVhNGUzMWZkZg%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQweW5ha2F5YW1hJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1jNjBlNjQ1NDBlZTAwOGRmYmE4NDZjZWI0YzlhN2RiOQ%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Dc766c0cd269b33a61cc4086d024d4c1f)