タグ

ブックマーク / iisssseeiiii.hatenablog.com (4)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~
  • bnlearnの続き - データサイエンティスト上がりのDX参謀・起業家

    Rでベイジアンネットの第二弾。 bnlearnでは基的に条件付回帰を行っているので、その回帰係数もbn.fit関数で出力できます。 その回帰係数を、グラフに無理やり出力させるとこうなります。 親ノードは説明変数がないので、単純に平均値になってます。 これくらいの出力はパッケージに組み込まれてたら親切だったのになぁ(あとnnetみたいに矢印の太さが係数に比例するとか)。 igraphパッケージもパスを描くのに向いてそうなので、そのうちこっちも調べてみます。 コードはこちら(前半は以前のせた記事と同じコード。後半から係数を描いてます。)↓ library(bnlearn) norm <- rnorm(4000) Data <- matrix(norm, nrow=1000, ncol=4, byrow=T) colnames(Data) <- c("Height", "BMI", "SBP"

    bnlearnの続き - データサイエンティスト上がりのDX参謀・起業家
  • データサイエンティスト上がりのDX参謀・起業家

    推定を作ってから約2ヶ月経ってからのコロナ陽性者数の推測結果、以下になりました。 第5波までの傾向だったらもう収束しているはずですが、収束しておらず、1日6,000〜7,000人くらいで停滞している感じです。これくらいの陽性者数が底になっている印象。恐らく、これからは今までと違う動きをすると思われるので、また違う推測モデルが必要かも。 2/6に、↓の記事で東京都のコロナ陽性者数に正規関数を当てはめて推移を予測しました。1ヶ月ほど経ったので、その予測の評価をしてみました。 iisssseeiiii.hatenablog.com 評価した結果は次の図のようになりました。 オレンジ線が実際の陽性者数で、青破線が2/6までのデータを使ったモデルで推測した値です。モデルを作ってから少し陽性者数が増加し、推測ではもっと増えると計算されてましたが、そこまで増えませんでした。ただ、その後の減り方は緩やかだ

    データサイエンティスト上がりのDX参謀・起業家
    oich
    oich 2011/04/06
  • 1