はじめに 多変量解析では、共変量と呼ばれる変数を決定する必要があります。 この変数の決定方法とその数についてまとめます。 変数選択について 結論から述べると、変数選択は「データを見ずに、アウトカムが同じ先行文献や医療・福祉などデータに関する専門家の意見を元に決定する」が最も良い方法となります。 これは、データの p 値などに引きずられずに、かつ必要な変数を除いてしまうことなく因果関係のあるデータを抽出できるためです。 一部の文献などで検定結果の比較を元に p 値の小さい変数を決定したり、ステップワイズ法で p 値の小さい順に決定するということを述べているものがありますが、この方法には問題があります。 p 値だけで決定してしまった場合、決定する変数と目的変数間の因果関係などは全く考慮されません。 そのため、特に医療・福祉統計において多くある、絶対に除いてはいけない変数を除いてしまうことがあり
![多変量解析における変数選択とその数 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/f06fde24247130092ec24b91b2ef6a2d10c959ab/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUU1JUE0JTlBJUU1JUE0JTg5JUU5JTg3JThGJUU4JUE3JUEzJUU2JTlFJTkwJUUzJTgxJUFCJUUzJTgxJThBJUUzJTgxJTkxJUUzJTgyJThCJUU1JUE0JTg5JUU2JTk1JUIwJUU5JTgxJUI4JUU2JThBJTlFJUUzJTgxJUE4JUUzJTgxJTlEJUUzJTgxJUFFJUU2JTk1JUIwJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1kZGE4Zjk3YmM1YzAxOGJlODcxMjk2NzIxMGJhNmE1Nw%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTcxNiZ0eHQ9JTQwdF9zZXJpemF3YSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTMyJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9MTAzODgwMTUxNzQ3YTE4ZDFjZjI4MmE3M2NlZDE2MGM%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D9a71e38d5b5897ec3c14b40d78a6966e)