今回はだいぶ小ネタ。 以前にこのブログでも記事にしたことがある scikit-learn の Pipeline 機能について。 blog.amedama.jp scikit-learn の Pipeline 機能は機械学習に必要となる複数の工程を一つのパイプラインで表現できる。 ただ、パイプラインを組んでしまうと途中のフェーズで出力がどうなっているか、とかが確認しにくい問題がある。 この問題について調べると以下の StackOverflow が見つかるんだけど、なかなかシンプルな解決方法だった。 stackoverflow.com 先に概要を述べると、特に何もしないフェーズを用意して、そこでデバッグ用の出力をするというもの。 下準備 まずは必要になるパッケージをインストールしておく。 $ pip install pandas scikit-learn scipy numpy Pipelin