タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

statsに関するma38suのブックマーク (2)

  • 2-3. 階級幅の決め方 | 統計学の時間 | 統計WEB

    ヒストグラムを作る際に大事な点は、階級の幅(度数を集計するための区間の大きさ)をどのくらいの大きさにするかという点です。2-1章で使用した各都道府県内にある映画館のスクリーン数のデータを用いて2つのヒストグラムを作成してみました。 ■階級の幅が200のヒストグラム 階級幅が200のヒストグラムでは、都道府県ごとのスクリーン数の分布がよく分かりません。一方、階級幅が18ののヒストグラムでは分布は分かるもののやや細か過ぎる印象を与えます。さらに階級の区切り方が中途半端であるため、階級値が分かりづらくなってしまっています。 階級の幅の決め方にルールはありませんが、グラフを一目見て分布の特徴が捉えられるようにすることが推奨されます。階級幅が大きすぎても、逆に小さすぎてもデータの大まかな分布が分かりづらくなってしまいます。階級幅の決め方で困った場合には、「スタージェスの公式」を使うこともできます。こ

    2-3. 階級幅の決め方 | 統計学の時間 | 統計WEB
    ma38su
    ma38su 2019/05/25
  • 「R言語による Random Forest 徹底入門−集団学習による分類・予測−」− #TokyoR #11 で講師をしてきました - hamadakoichi blog

    2011/01/29 第11回R勉強会@東京(Tokyo.R #11) で講師をしてきました。 「R言語による Random Forest 徹底入門 −集団学習による分類・予測−」。 Random Forest は"機械学習"の方法論で、集団学習により精度高い判別・予測を実現します。 双方向の進行で、質疑応答・議論含め 合計60分で話しました。 「R言語による Random Forest 徹底入門 −集団学習による分類・予測−」 - #TokyoR #11View more presentations from Koichi Hamada. 隠れ Random Forest 祭り 今回のTokyo.R、実は「隠れ Random Forest 祭り」。直前の3トーク、「3. caretパッケージの紹介」(id:dichika [Twitter:@dichika])、「4. RにおけるHPC

    「R言語による Random Forest 徹底入門−集団学習による分類・予測−」− #TokyoR #11 で講師をしてきました - hamadakoichi blog
    ma38su
    ma38su 2011/09/27
  • 1