タグ

pythonと時系列に関するkoma_gのブックマーク (13)

  • 「Prophet」とは――Facebook製時系列予測OSSは何が便利なのか

    機械学習の中でも古典的なテーマの一つである「時系列予測(時系列解析、時系列分析)」においては、昔からある「AR(Auto Regression:自己回帰)」モデルから最先端のディープラーニングを用いた「LSTM」(Long Short-Term Memory)までさまざまなアルゴリズムが存在しています。 それらの中でも近年注目を集めているのが、Facebookが開発した時系列予測のオープンソースソフトウェア(OSS)ライブラリ「Prophet」です。Python実装、R実装が公開されています。 連載ではProphetの概要と理論的背景、案件で使ってみた経験から得られた知見を紹介します。「そもそもProphetとは何か」「他の手法との差異は何か」「チューニングのテクニック」「運用で気を付けるべき点」などを紹介しながら、Prophetへの理解を深めることを目的に、2回の連載を予定しています。

    「Prophet」とは――Facebook製時系列予測OSSは何が便利なのか
  • 将来予測で用いられるライブラリ「Prophet」 | スキルアップAI Journal

    こんにちは。スキルアップAIの橋です。 ブログでは、AIを利用した時系列解析、特に将来予測でよく用いられているライブラリである「Prophet」について解説します。 近年、将来予測の定番となっているProphetですが、ライブラリによる実装方法に関する情報は簡単に入手できます。一方で、Prophetの理論的な部分についてはあまり知られていないため、ブログでは理論部分を重点的に取り上げたいと思います。 時系列解析(分析)とは|概要やメリット、モデル、進め方、事例を紹介 1.Prophetの概要 まず初めに、Prophetの基情報をまとめます。 Prophetは2017年にFacebookのCore Data Science teamによって開発された時系列解析用のライブラリです。PythonとRの両方でライブラリが提供されています。 また、このProphetは、将来予測のタスクにおい

    将来予測で用いられるライブラリ「Prophet」 | スキルアップAI Journal
  • DATAFLUCT Tech Blog

    2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

    DATAFLUCT Tech Blog
  • Pandasで時刻データを扱うTimestampの使い方

    Timestampクラス TimestampクラスのAPIドキュメント params: Timestampクラスオブジェクトの生成 直接生成 to_datetime関数を使った生成 date_range関数を使った連続した時刻データの生成 Timestampオブジェクトから情報取得 タイムゾーンの指定 offsetsオブジェクトを使った加減 日付データの差をとる まとめ 参考 Python上で時系列データを扱う際はdatetimeモジュールを使うのが基です。 例えばですが、現在時刻を取得したい時は以下のように書きます。 In [1]: import datetime In [2]: time = datetime.datetime.now() In [3]: time Out[3]: datetime.datetime(2018, 9, 21, 10, 29, 17, 681135) こ

    Pandasで時刻データを扱うTimestampの使い方
  • pandas.DataFrame, Seriesを時系列データとして処理 | note.nkmk.me

    pandas.DataFrame, Seriesのインデックスをdatetime64[ns]型にするとDatetimeIndexとなり、時系列データとして様々な機能が使えるようになる。 ここでは、以下の内容について説明する。 CSV読み込み時にDatetimeIndexを設定する方法 既存データの列をDatetimeIndexとして指定する方法 時系列データの行を年・月・日などで選択して抽出 最後に説明するように、時系列データとして扱うと年や月で行を指定したりスライスで期間を抽出したりできて便利。 曜日や年・月ごとの合計や平均を算出するのも簡単にできるようになる。 関連記事: pandasで時系列データの曜日や月、四半期、年ごとの合計や平均を算出 文字列とdatetime64[ns]型との相互変換や年月日・時刻を数値として抽出する方法、タイムゾーンの扱いについては以下の記事を参照。 関連記

    pandas.DataFrame, Seriesを時系列データとして処理 | note.nkmk.me
  • Pandas入門講座|13.時系列データの扱い方【PythonのライブラリPandas】

    こんにちは。キノコードです。 この動画では、時系列データ処理について学びます。 時系列データとは、時間を軸に記録されたデータの集まりです。 時系列データの代表的なものには、人口推移のデータや気温や湿度などの気象データ、株価のデータなどがあります。 Pandasでは、データフレームのインデックスを日付型にすることで時系列データとして扱えるようになります。 こうすることで、指定した日数での集計、月末だけの集計、週次や月次の集計などが簡単にできます。 株価などの経済データを好きな期間で分析することもできますし、移動平均や指標となる数値を追加すればさらに深い分析まで可能になります。 このレッスンでは、あるアパレル会社の販売データを用いて説明をします。 準備として、キノコードのサイトに用意しているcsvファイルを2つ、ダウンロードしてください。 そして、学習用のJupyter Labを保存しているフ

    Pandas入門講座|13.時系列データの扱い方【PythonのライブラリPandas】
  • pandasの時系列データにおける頻度(引数freq)の指定方法 | note.nkmk.me

    pandasの時系列データに対するメソッドの引数で頻度(freq)を指定することが度々ある。頻度を表す文字列(頻度コード)と数値で任意の頻度や期間を指定できる。 例えば元データをリサンプリングするresample()やasfreq()メソッドなどで使う。 関連記事: pandasで時系列データをリサンプリングするresample, asfreq ここでは例としてpd.date_range()を使って、頻度(freq)の指定方法について説明する。 pandas.date_range — pandas 0.23.3 documentation 以下の内容について説明する。 頻度コード一覧 日付関連 時刻関連 数値で間隔を指定 複数の頻度コードの組み合わせ pandas.DataFrameやpandas.Seriesのインデックスをdatetime64型のDatetimeIndexとして設定し時

    pandasの時系列データにおける頻度(引数freq)の指定方法 | note.nkmk.me
  • 時系列モデル(ARIMA/Prophet/NNなど)を統一的なAPIで扱えるPythonライブラリ「Darts」がかなり便利 - フリーランチ食べたい

    時系列モデルを扱う上でデファクトスタンダードになりそうなPythonライブラリが出てきました。 時系列モデルを扱うPythonライブラリは、 scikit-learn のようなデファクトスタンダードなものがありません。そのため時系列モデルを用いて実装を行うためには、様々なライブラリのAPIなどの仕様を理解しつつ、それに合わせてデータ整形を行い、評価する必要があり、これはなかなか辛い作業でした。 スイスの企業 Unit8 が今年(2020年)6月末に公開した Darts はまさにこういった課題を解決するライブラリです。時系列に関する様々なモデルを scikit-learn ベースのAPIで統一的に扱うことができます。 github.com Darts は現在、下記のモデルに対応しています。内側では statsmodels 、 Prophet(stan) 、 Pytorch などを使っていて、

    時系列モデル(ARIMA/Prophet/NNなど)を統一的なAPIで扱えるPythonライブラリ「Darts」がかなり便利 - フリーランチ食べたい
  • 時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ

    記事では、時系列予測に利用できるpythonのライブラリの使い方について説明をします。 パッとライブラリを使うことを目指すため具体的なアルゴリズムの説明は省きます。 ※説明が間違えている場合があればご指摘いただけると助かります。 目次 利用データ ライブラリ Prophet PyFlux Pyro Pytorch Lightgbm 補足:Darts まとめ ソースコード このブログで記載されているソースコードはGitHubに上げておいたのでもしよろしければ参考にしてください。 github.com 利用データ 今回用いるデータはkaggleのM5 Forecasting - Accuracyと呼ばれるコンペティションで利用されたデータを用います。 作成したランダムなデータよりも実データのほうが予測をしている感があるからです。 予測に使うデータはwalmartの売上データです。 下図はその

    時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ
  • 時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、Microsoft

    時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、MicrosoftPythonやR向け Microsoftは、時系列予測のベストプラクティスを共有するためのGitHubリポジトリを開設した。PythonやRを使っている開発者に向けたものだ。 Microsoftの「R」コミュニティー向けブログサイト「Revolutions」は、2020年4月14日(米国時間)、時系列予測のベストプラクティスを共有するためのGitHubリポジトリ「Time Series Forecasting Best Practices & Examples」を開設したと発表した。 Microsoftはこのリポジトリについて、README.mdで次のように説明している。 「時系列予測は、データサイエンスで最も重要なトピックの一つだ。的確な意思決定と効果的な資源配分を行うために、ほぼ全ての企業には未来

    時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、Microsoft
  • A Comprehensive Beginner's Guide to Creating a Time Series Forecast (With Codes in Python and R)

    Introduction Time Series (referred as TS from now) is considered to be one of the less known skills in the data science space (Even I had little clue about it a couple of days back). I set myself on a journey to learn the basic steps for solving a Time Series problem and here I am sharing the same with you. These will definitely help you get a decent model in any future project you take up! Before

    A Comprehensive Beginner's Guide to Creating a Time Series Forecast (With Codes in Python and R)
  • Pythonによる時系列分析の基礎 | Logics of Blue

    Pythonを使った時系列解析の方法について説明します。 時系列データの読み込みから、図示、自己相関などの統計量の計算といった基礎から始めて、自動SARIMAモデル推定までを説明します。 この記事を読めば、簡単なBox-Jenkins法についてはPythonで実装する方法が身につくかと思います。 JupyterNotebookでの実行結果はリンク先から確認できます。 目次 時系列分析とは 時系列データの読み込み 時系列データの取り扱い 自己相関係数の推定 ARIMAモデルの推定 SARIMAモデルの推定 総当たり法によるSARIMAモデル次数の決定 1.時系列分析とは 時系列分析とは、その名の通り、時系列データを解析する手法です。 時系列データとは、例えば「毎日の売り上げデータ」や「日々の気温のデータ」、「月ごとの飛行機乗客数」など、毎日(あるいは毎週・毎月・毎年)増えていくデータのことで

    Pythonによる時系列分析の基礎 | Logics of Blue
  • さくっとトレンド抽出: Pythonのstatsmodelsで時系列分析入門 - Gunosyデータ分析ブログ

    久しぶりの投稿になってしまいましたが、ニュースパス(現在CM放映中!!)開発部の大曽根です。 作業中はGrover Washington Jr のWinelightを聴くと元気が出ます。参加ミュージシャンが素晴らしいですね。 なぜ時系列分析をするのか 季節調整 実演 おまけ: 時間別に見てみる まとめ 今後 なぜ時系列分析をするのか 数値を非常に重視している弊社では、数値を知るためのツールとしてRedashやChartioおよびSlackへの通知を活用しています。現在の数値を理解する上では、長期のトレンド(指標が下がっているのか、上がっているのか)を知ることが重要です。しかし、日々変化するデータ(特に売上やKPIと言われる指標)は、ばらつきも大きく、変化を適切に捉えることが難しいこともあります。 特にSlackなどへの通知を行っていると、日々の変化に囚われがちです。例えば、弊社ではニュース

    さくっとトレンド抽出: Pythonのstatsmodelsで時系列分析入門 - Gunosyデータ分析ブログ
  • 1