盛岡旅行記 なぜ盛岡か。 白龍 本店のじゃじゃ麺 岩手銀行赤レンガ館 白沢せんべい店の南部せんべい 盛岡天満宮と盛岡八幡宮 チーズケーキのチロル 大通店のクリームチーズケーキ フェザン/イオンタウン 盛岡駅前 盛楼閣の盛岡冷麺 福田パン 長田町本店のパン マルイチ 材木町店 …
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
久しくご無沙汰しておりました。 書くネタ自体は山ほどあるんですが、本業が凄い勢いで動いているのでそっちに集中していましたです。 さて、たまには分析チックなお話を。統計でガチガチの石頭になってしまわないように、常に僕が気をつけていることの1つが「選択バイアスの罠」です。 生還した戦闘機、しなかった戦闘機 あ、ちなみに、いまきは別に統計や分析の(アカデミックな意味での)専門家ではないので、そのあたりはご容赦を(汗 時に1940年ごろ。 世界は第二次世界大戦の真っ只中です。 統計学者のエイブラハム・ワルドという方が戦闘機の脆弱性について調査していたそうです。 帰還した戦闘機の大量のデータが彼の元に届きます。 「入手したデータどれもが、戦闘機のある部分の被弾頻度が他の部分よりも過度に多いことを示していた。」 さて、ここからどういう結論を導けばいいのでしょうか? (ちょっと立ち止まって考えてから読ん
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く