タグ

ブックマーク / qiita.com/takuya_tsurumi (2)

  • 【機械学習】決定木モデルの違いをまとめてみた

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 1.はじめに 以前の投稿で、機械学習について2つの記事を書きました。 全体像(機械学習初学者の私に告ぐ「4つの忠告」の2-2)と 前処理(機械学習のデータ前処理備忘録)についてです。 他の箇所についてもまとめていきます。 2.機械学習の全体像振り返り 以前の記事でも紹介した機械学習の全体像を以下に示します。 今回は赤枠で囲った手法選択についてです。 図.2-1 機械学習の全体像 この手法選択の中でも最近私がよく使用している決定木モデルについてまとめます。 決定木モデルは、回帰モデルと分類モデルとどちらもライブラリとして用意されていますが

    【機械学習】決定木モデルの違いをまとめてみた
  • 機械学習のデータ前処理備忘録 - Qiita

    1.はじめに 前回の記事で機械学習は「データ前処理が8割」と書きました。 今回はそのデータ前処理として私が実施していることを備忘録として書いておきます。 まだまだ至らない点等あるかと思いますので、間違いなどご指摘いただけると幸いです。 2.前処理の必要性 まず、全体像から把握しておくことが大切なので、 機械学習の全体像で見た前処理の立ち位置を以下図に示します。 図.機械学習の全体像から見た前処理の立ち位置 前処理が必要な理由は以下のようなことが挙げられます。 ・機械学習のモデルは文字列データではなく数値データで渡す必要があるため ・上記同様、欠損値(null)があるデータも変換しないと機械学習のモデルに渡せないため ・精度を向上させるため ・リーケージの発生を防ぐため etc... 3.前処理の具体例 前処理は具体的に以下のようなことを実施します。 ・カテゴリーデータの処理 ・欠損値処理

    機械学習のデータ前処理備忘録 - Qiita
  • 1