タグ

2023年5月16日のブックマーク (4件)

  • PythonによるSARIMAXモデルを使った「TVCMの効果検証」への挑戦 - LIFULL Creators Blog

    ※この記事はLIFULL Advent Calenderの20日目です こんにちは! LIFULLでデータアナリストをしている竹澤(@Akira Takezawa)です. 今回は, LIFULLのデータアナリストチームの取り組みを紹介します. 記事はデータ分析に興味がある方を対象に, 「マーケティングの実務で生かせる時系列分析」をテーマに執筆しました. まず, なぜこの記事を書いたかを簡単に説明します. 近年, 機械学習やディープラーニングの台頭を筆頭に近年データ分析の手法は爆発的に増え続けています. 一方で実際のビジネスの現場で見えてくるのは, 「派手さや新しさのみに捉われず, 古今東西変わらず価値を提供し続けてきた分析手法こそ重要ではないか」というもう一つの側面です. 具体的には相関・回帰分析や検定などがそうですが, 同時に「時系列分析」もビジネスの世界で活用機会が多く, パワフルな

    PythonによるSARIMAXモデルを使った「TVCMの効果検証」への挑戦 - LIFULL Creators Blog
    isayaf884
    isayaf884 2023/05/16
    季節調整+自己回帰和分移動平均+外生変数がSARIMAX
  • 時系列データの予測ライブラリ--PyFlux-- - Qiita

    モチベーション 時系列データは動画、FXの取引額の遷移、気温の遷移など幅広い分野で使用されるデータです。そのデータを学習し予測できればそれに合わせた施作を打つことができ、ちょっとした未来予測につながります。 そのような魅力的な時系列データを簡単に予測することができるライブラリPyFluxについて紹介します。 pyfluxの特徴 scikit learnライクに記述可能 描画のメソッドが標準で実装済み 学習後のパラメータの確認が容易 時系列データ独特な特徴 連続 時間、空間、場所 潜在的な依存構造 トレンド、シーズン、周期性など 動的な挙動 突然の変化、ゆるやかな変化 時系列データの予測に対する2つのアプローチ 予測 深層学習や線形回帰などのアプローチ 確率分布 確率分布を用いたアプローチ PyFluxでは確率分布を用いたアプローチをしています。 ワークフロー 下記のワークフローで考えます。

    時系列データの予測ライブラリ--PyFlux-- - Qiita
    isayaf884
    isayaf884 2023/05/16
    ARIMAを多変数にしたものがARIMAX
  • Pandasのgroupbyを使った要素をグループ化して処理をする方法 - DeepAge

    グループ分けした処理の概要 groupby関数を使ってデータをグループ分けする(Splitting) 列データからグループ分け 複数の列データから作成 Indexの値を使う MultiIndexでグループ分け GroupByオブジェクトの中身を確認する GroupByオブジェクトをイテレータとして扱う 特定の列データを指定する グループごとに処理を実行する(Applying) Pandasの組み込み関数を使う apply関数を使って適用させる 複数の関数を一度に適用させる 列ごとに処理を指定する transform関数を使ったデータ整形 フィルタリング グラフにプロットする まとめ 参考 Pandasでの代表的な機能の1つとしてgroupby関数があります。 これはデータをある列データなどを基準にグルーピングして処理を行うために使います。例えば、事業部ごとの売上や、年代別での成績などを算出

    Pandasのgroupbyを使った要素をグループ化して処理をする方法 - DeepAge
  • FY (fiscal year, 会計年度)とは 意味/解説 - シマウマ用語集

    FYとは、fiscal yearもしくはfinancial yearの略で、「会計年度」もしくは単に年度を意味する英語である。「FY2020」のように表記する。 会計期間が2020年4月~2021年3月の場合、日では会計年度を期の始まりの日を含む年で表し「2020年度」となるが、海外では期末を含む年で表し「FY2021」となる。 会計年度の「FY」に対し、歴年はcalendar yearの略で「CY」と表す。

    FY (fiscal year, 会計年度)とは 意味/解説 - シマウマ用語集
    isayaf884
    isayaf884 2023/05/16
    YoYは前年比