用語「シンプソンのパラドックス」について説明。主に層別の分割表において、グループ間に見られる相関関係が「全体でも成り立つだろう」と直感的に推測されるのに対し、場合によっては、全体では異なる結果になる現象を指す。 連載目次 用語解説 シンプソンのパラドックス(Simpson's paradox)とは、主にデータをいくつかのグループ(層)に分割した表において、グループ間に見られる相関関係(前提)が「全体でも成り立つだろう」と直感的に推測されるのに対し、場合によっては、実際にデータ全体に見られる相関関係(結果)が前提とは真逆になってしまう(もしくは一致しない)というパラドックス(逆説)現象を指す。統計学の用語である。その原因としてよくあるのは、各グループの個体数(サンプルサイズ)が大きく異なることだ。……という説明文だけだと分かりづらいと思われるので、次節で具体例を出してあらためて説明する。 こ