タグ

ブックマーク / hoxo-m.hatenablog.com (2)

  • ヒストグラム作成の裏側: R 関数探訪 hist() 編 - ほくそ笑む

    先日、簡単にヒストグラムを作成できるサイトを作ったわけですが、内部は R の hist() 関数を参考にさせてもらいました。 ヒストグラムの作成なんて簡単そう、と思われる方もいらっしゃるかもしれませんが、結構複雑です。 今日は、この複雑な hist() 関数を、コアの部分だけ取り出して、簡単に説明しようと思います。 階級数を決める まず、ヒストグラムを作成するときの問題点として、階級数をどうするかというのが問題になります。 つまり、データをいくつの領域に分割するか、ということです。 ヒストグラムの形状は、階級の分け方によって様々に変わります。 サンプルの数が少ないのに階級を多く分けてしまうと、縦がつぶれたヒストグラムができます。 逆に、階級数が少なすぎると横がつぶれてしまいます。 hist() 関数では、自動的に階級数を決める方法として、 スタージェスの方法 フリードマン-ディアコニスの方

    ヒストグラム作成の裏側: R 関数探訪 hist() 編 - ほくそ笑む
  • 簡単にヒストグラムを作成できるサイトを作った - ほくそ笑む

    私は仕事でマイクロアレイの統計解析をやっています。 お客様からデータを頂いて、それを統計解析にかけるわけですが、マイクロアレイのデータ解析で一番最初にやることというのは、ヒストグラムを作ることです。 データの分布っていうのは統計解析をやる上では一番最初に見ておきたいものですよね。 それで、ヒストグラムを作るわけですけど、お客様から頂くデータはほとんどの場合 Excel です。 ところが、Excel にはヒストグラムを作ってくれる機能が無いわけです。*1 そんなわけで、私の場合は統計ソフト R を使ってヒストグラムを描くわけですけど、これがもう超簡単です。 hist(data) って打つだけで、ヒストグラム作れちゃう。 階級数とか階級幅とか、なんかいい感じにしてくれる。 めんどくさい設定一切なし。 というわけで、R サイコー!ってなわけなんですが、一つだけ欠点があります。 Excel のデー

    簡単にヒストグラムを作成できるサイトを作った - ほくそ笑む
  • 1