Boeing’s Starliner spacecraft has successfully delivered two astronauts to the International Space Station, a key milestone in the aerospace giant’s quest to certify the capsule for regular crewed missions. Starliner…
データ解析の重要性が認識されつつある(?)最近でさえも,A/Bテストを始めとしたテスト( = 統計的仮説検定:以後これをテストと呼ぶ)の重要性が注目される事は少なく,またテストの多くが正しく実施・解釈されていないという現状は今も昔も変わっていないように思われる。そこで,本シリーズではテストを正しく理解・実施・解釈してもらう事を目的として,テストのいろはをわかりやすく説明していきたいと思う。 スケジュール スケジュール 第1回 [読み物]:『人間の感覚のみでテスト結果を判定する事の難しさについて』:人間の感覚のみでは正しくテストの判定を行うのは困難である事を説明し,テストになぜ統計的手法が必要かを感じてもらう。 第2回 [読み物]:『「何をテストすべきか」意義のある仮説を立てるためのヒント』:何をテストするか,つまり改善可能性のある効果的な仮説を見いだす事は,テストの実施方法うんぬんより本質
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
カルトグラム(統計地図、[英]cartogram)とは統計データに基づいて面積や距離を伸縮した地図のこと。例えばGDPに基づいた世界地図のカルトグラムでは米中日や欧州の面積が肥大し、アフリカの面積は縮小する。世界地図については、FedExが素晴らしいサイトを公開している。 カルトグラムを生成するソフトウェアのひとつにScapeToadがある。これを使って都道府県別の統計データを基に日本地図のカルトグラムを作ってみた。 (比較として通常の地図) 人口 県内総生産 年間降雪量 お好み焼き屋の数 年間うどん・そば消費量 うどんだけというデータがなかった。 使用データ 行政区分のある日本地図データ(シェープファイル): Free Spatial Data | DIVA-GIS 都道府県別の各統計データ: とどラン
強い暑さストレス増加日数のトップ国はイスラエルの年28日増、トップ地域ではメキシコ、コロンビアの年40日増。日本は年7日増で国内は北関東・甲信の年9日増が最多。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く