先日、簡単にヒストグラムを作成できるサイトを作ったわけですが、内部は R の hist() 関数を参考にさせてもらいました。 ヒストグラムの作成なんて簡単そう、と思われる方もいらっしゃるかもしれませんが、結構複雑です。 今日は、この複雑な hist() 関数を、コアの部分だけ取り出して、簡単に説明しようと思います。 階級数を決める まず、ヒストグラムを作成するときの問題点として、階級数をどうするかというのが問題になります。 つまり、データをいくつの領域に分割するか、ということです。 ヒストグラムの形状は、階級の分け方によって様々に変わります。 サンプルの数が少ないのに階級を多く分けてしまうと、縦がつぶれたヒストグラムができます。 逆に、階級数が少なすぎると横がつぶれてしまいます。 hist() 関数では、自動的に階級数を決める方法として、 スタージェスの方法 フリードマン-ディアコニスの方
![ヒストグラム作成の裏側: R 関数探訪 hist() 編 - ほくそ笑む](https://cdn-ak-scissors.b.st-hatena.com/image/square/c9dfa457b74b8920d16c7813afaad8e4848c5fb1/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fh%2Fhoxo_m%2F20111120%2F20111120182414.png)