タグ

ブックマーク / pythondatascience.plavox.info (3)

  • scikit-learn で回帰モデルの結果を評価する

    ページでは、Python機械学習ライブラリの scikit-learn を用いて、回帰モデル (Regression model) の予測精度を評価する方法を紹介します。 回帰モデルの評価にはいくつかの指標があり、ページでは主要な指標として、MAE, MSE, RMSE, 決定係数の 4 つを紹介します。 平均絶対誤差 (MAE) 平均絶対誤差 (MAE, Mean Absolute Error) は、実際の値と予測値の絶対値を平均したものです。MAE が小さいほど誤差が少なく、予測モデルが正確に予測できていることを示し、MAE が大きいほど実際の値と予測値に誤差が大きく、予測モデルが正確に予測できていないといえます。計算式は以下となります。 (: 実際の値, : 予測値, : 件数) scikit-learn には、sklearn.metrics.mean_absolute_er

  • scikit-learn でクラス分類結果を評価する

    ページでは、Python機械学習ライブラリの scikit-learn を用いて、クラス分類 (Classification) を行った際の識別結果 (予測結果) の精度を評価する方法を紹介します。 混同行列 (Confusion matrix) 機械学習を用いたクラス分類の精度を評価するには、混同行列 (Confusion matrix, 読み方は「コンフュージョン・マトリックス」) を作成して、正しく識別できた件数、誤って識別した件数を比較することが一般的です。 以下の表は、電子メールのスパムフィルタ (迷惑メールフィルタ) の精度評価を行なう場合の混同行列の例で説明します。混同行列は横方向に識別モデルが算出した識別結果、縦に実際の値 (正解データ) を記します。 例えば、スパムフィルタの場合、横方向に「スパム、またはスパムでないとモデルが識別した件数」、縦方向に「実際にそのメー

  • Seaborn でヒートマップを作成する

    ページでは、Python のデータ可視化ライブラリ、Seaborn (シーボーン) を使ってヒートマップを出力する方法を紹介します。 Seaborn には、ヒートマップの可視化を行うメソッドとして seaborn.heatmap と seaborn.clustermap の 2 つが実装されています。seaborn.heatmap は通常のヒートマップを出力しますが、seaborn.clustermap は、クラスタ分析を行い、デンドログラムとともにヒートマップを出力します。 heatmap: ヒートマップの可視化 seaborn.heatmap メソッドは、色の濃淡や色相でデータの密度や値の分布を可視化します。 seaborn.heatmap の使い方 seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None,

  • 1