この場合に、たとえば「9999」と記入した回答があったらどうしましょう。回答者は1億円以上の年収があるので、こう表現したのだと思います(1億円を超える場合に、回答者を悩ませる点でもこの自由記入は、あまり良い例とは言えませんが、それは今回置いておきましょう)。 この場合は、この質問のこの回答だけを「外れ値」として集計から除く処理を行うという判断をすることがあります。世帯年収の単純平均を算出すると、この回答が平均値をかなり押し上げてしまうからです。 年収などの場合は、その回答の分布はなだらかな山の形を形成することが多いのですが、分布から極端に離れた値にごく少数の回答が存在することがあります。これを異常値として排除するのです。科学の実験などでもこういった処理を行うことがあります。 普通の調査では、中央値や最頻値を併用するとよい全体を代表する値という指標はいくつかあります。平均値は最も代表的な指標
![アンケート結果の平均値の出し方! 中央値/最頻値との違いや最適な集計方法 | リサーチ/データのリテラシー入門——調査統計の基礎知識](https://cdn-ak-scissors.b.st-hatena.com/image/square/3d6a69437e3d5a6c00a55dfb202aef55d361cd9e/height=288;version=1;width=512/https%3A%2F%2Fwebtan.impress.co.jp%2Fsites%2Fdefault%2Ffiles%2Fstyles%2F1200x630%2Fpublic%2Fimages%2Fresearch-literacy%2Fresearch-literacy-icon.gif%3Fitok%3DUnu0vB15)