sklearn-pandas とは? pandasのDataFlameからsklearnのモデルやpiplineを使う際に若干の煩わしさが残っていたが、最近はsklearn-pandasというパッケージが開発されており扱い易くなっているようだ。 このパッケージを使うと、例えば次のようなことができるようだ。 * pandasのDataFlameをそのまま入力できて、なおかつ、出力もDataFlameで取り出せる。 * 特定のコラム(特徴量)のみへの処理をsklearnのmodelと同様の形式で定義できる。 * 従来より柔軟なpipelineを作成できる。 従来、pandasのDataFlameをsklearnの適当なmodelで学習する場合、DataFlameの特定のコラムのみを抽出し、エンコーディング、欠損補完、スケーリング等を行った後、np.arrayとして、sklearnのmodel(