こんにちは!突然ですが、皆さんは下のような二種類の時系列データを判別できるような特徴量を抜き出したいときに何を考えますか?そしてどうやって特徴量を抽出しますか? 私はパッと見て次の手法を使えば特性が取り出せると思いました。 ピークの数 → k近傍法 ノイズの大きさ → 分散統計量 時系列方向で周期成分の大きさ → Wavelet変換 しかし、当然これだけでは十分な数の特性を網羅できていないでしょうし、適切な特性を抜き出すためにパラメータチューニングを行う必要があります(例えば、Wavelet変換であれば適切な基底関数を選ぶ必要があります)。 このように時系列データの特徴量エンジニアリングは調べることが無限にあり、どの特徴量を算出するかを考えているだけで日が暮れてしまいます。また、抜き出す特徴量が決まったとしてもモノによっては計算が複雑で実装に時間がかかってしまう場合もあります。 そんなとき
![時系列データから大量の特徴量を生成するパッケージ「tsfresh」の使い方|CO-WRITE](https://cdn-ak-scissors.b.st-hatena.com/image/square/9170c3a875c05b8ff7d1c1d072051ad1ce7b0ea1/height=288;version=1;width=512/https%3A%2F%2Fgri.jp%2Fmedia%2Fwp%2Fwp-content%2Fuploads%2F2022%2F05%2Ficatch_Python.png)