はじめに 初心者向けにpythonでのデータ前処理から機械学習モデル構築までを解説したいと思います。 機械学習には勾配ブースティングを使用します。 ソースコード https://gitlab.com/ceml/qiita/-/blob/master/src/python/notebook/first_time_ml.ipynb 本記事の内容 目次 1.データの前処理 1-1.データの読み込み 1-2.データの結合 1-3.欠損地補完 1-4.特徴量作成 1-5.データ分割 2.機械学習 2-1.データセット作成とモデルの定義 2-2.モデルの訓練と評価 2-3.特徴量の重要度を確認 データセットについて ・提供元:カルフォルニア工科大学 ・内容:心臓病患者の検査データ ・URL :https://archive.ics.uci.edu/ml/datasets/Heart+Disease ・