実験 訓練データで学習した学習済みモデルに対し、「モデルのfeature importance」及び「モデルとテストデータから算出されるSHAP」を比較します。 今回は再現性の確保のためにsklearnのサンプルデータセットである、lord_wine()データセットを用いて、多値(3値)分類モデルにおいて実験を行いました。 環境は以下です。 ・ macOS 13.2.1 ・ Python 3.11.7 データに関する説明 元のデータは13個の説明変数と1つの目的変数からなります。 目的変数はclass_0,class_1,class_2の3クラスからなります。 目的変数別のサンプル数は(class_0,class_1,class_2)=(59,71,48)となっており、サンプル数に若干の偏りがあるデータとなっています。 今回のコードでは、訓練データは(class_0,class_1,cla
