タグ

qiitaとlag-operatorに関するnabinnoのブックマーク (2)

  • 時系列データ分析の処理でやってはいけないこと(反省を含めて) - Qiita

    (追記1)用語("in-sample", "out-of-sample")の使い方が不適切との指摘をいただきました.記事の後半部にこの点,追記いたしました. (追記2)を後半部に加えました. Qiita投稿した後,内容の誤りに気がついても,手間を惜しんでそのままになってしまいがちである.ごく小さな誤記であればまだいいが,理論的な誤りや勘違いにおいては,間違った発信が続いていることには違いなく,反省しなければならない.(記事削除が手っ取り早いのですが,「いいね」がついていたりすると削除も失礼かと... ) さて,以前 回帰モデルの比較 - ARMA vs. Random Forest Regression - Qiita で時系列データからLag(遅れ)を特徴量として使う Random Forest回帰のやり方を紹介している. 今回は単変量の時系列データであるが,いくつかの過去のデータ使っ

    時系列データ分析の処理でやってはいけないこと(反省を含めて) - Qiita
  • 【BigQuery】LAG関数,LEAD関数の使い方 - Qiita

    1. LAG関数,LEAD関数で前後のデータを持ってくる SELECT句でLAG関数,LEAD関数を使うと,指定したカラムの行の前後のデータが得られます。 試しにカラム「number」の両隣に1日前,1日後の「number」のデータを付与して比較できるようにしてみましょう。 SELECT date, day, --LAG()内で,参照するカラム名とずらす行数を指定 --1行の場合はLAG(number)と省略しても問題なし --BigQueryでは,OVER()内でどのカラムで並べるか(ORDER BY)の指定は必須,今回は日付順で並べ替え LAG (number, 1) OVER (ORDER BY date) AS lag_data, number, --LEAD()内で,参照するカラム名とずらす行数を指定 --1行の場合はLEAD(number)と省略しても問題なし LEAD (nu

    【BigQuery】LAG関数,LEAD関数の使い方 - Qiita
  • 1