ビジネスでデータサイエンスを活用するシーンとして、過去データを使って将来を予測するタイプの問題がある。商品販売数や店舗売上高など、折れ線グラフを使って表現するようなデータ(時系列データ)に基づいた時系列分析だ。過去の販売データに基づいて翌月の発注量を決めたり、3年後など中長期の計画を策定したりするのに使う。今回は、この時系列分析に活用しやすい3つのアルゴリズムを見ていこう。 Prophet
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
以前、【LT大会#7】LLMの活用・機械学習・データ分析関係のいろいろな話題にふれようで、時系列基盤モデルについてLTをさせて頂きました。 他発表者のLTも面白く、私自身も時系列基盤モデルについて理解を深める良いきっかけとなりましたが、心残りはLLMを絡めた手法については時間を割けなかったことです。 そこで今回はLLM for 時系列分析に関するアイディアを簡単にまとめてみます。 おことわり 学習目的で調査・作成した内容がベースとなっており、誤りや他に面白い論文・事例がありましたら、教えて頂けますと幸いです。 主に以下Survey論文・Collectionリポジトリで取り上げられている内容の一部を対象としています。より網羅的に知りたい方は下記リソースを直接ご参照ください。 Large Language Models for Time Series: A Survey Position: W
こんにちは! 以前にDartsという時系列分析に特化したpythonライブラリを紹介しました。 前編はこちら 今回は実際にDartsを動かしていきましょう。 Darts内にもデータセットがありますが、公式でも触れられているのであえて、外部のデータを参照してみましょう。導入編でも触れたアイスクリームの生産量の変化を推測したいと思います。 アイスクリームのデータセットはこちら 上記リンクの上部右側Downloadからcsvをダウンロードしてください。 Dartsのインストールは以下の1コマンドです。Windowsではデフォルトのコマンドプロンプトでうまくインストールが終了しなかったので、WSL環境などを推奨します。 $ pip install darts ARIMAで学習してみる バックテストでモデルの選定を行う RNNで共変量を扱ってみる まとめ ARIMAで学習してみる まずは、導入編で最
新型コロナウイルスの学校の休校について岩田健太郎先生の新しい論文がプレプリントで出ております。査読はされていませんのでご注意ください。 www.preprints.org https://www.preprints.org/manuscript/202004.0058/v1 前回に引き続き、日本語訳させてもらっております(1)。大急ぎでしたので誤訳などありましたご指摘お願いいたします。 Was School Closure Effective in Mitigating Coronavirus Disease 2019 (COVID-19)? Time Series Analysis Using Bayesian Inference 新型コロナウイルス感染症(COVID-19)の緩和に学校閉鎖は効果は? ベイズ推定を使用した時系列分析 Kentaro Iwata * , Asako Doi
三十路過ぎてから国際結婚した純ジャパ、日本人男性のTOEICスコア分析。 どうも、ブレスルです。 国際結婚という家庭の事情。 妻がカナダ人、将来的に国に戻りたい移行があります。 そんな中で去年9月末から給付金を活用して学校へ秋入学。 本格的に腹をくくって英語学習を11年ぶりに再開しました。 自分の英語力のピークは大学2年次の大学転入試験前。 上智大、神戸大、学習院大への転校を夢見て心理学&英語を勉強。 転入試験は専門論文の英文和訳が中心。 TOEICとは異なる勉強方法でしたがそれでも英語力に関してはあの時がピーク。 結果的にマーチ関関同立、外語大学の3校へ合格し、成功体験を獲得。 学歴コンプレックスは一応解消されそこからは英語は全く手をつけていません。 んで今回の結果。 TOEIC公式認定証のアビメを分析してみると 総合的なアビメの素点は大学転入前の620点から649点へ向上。 本格的な勉
3つの要点 ✔️ 時系列データから特徴的な「連鎖」を探すという比較的新しい手法が強力にアップデートされました ✔️ データが変化していく中で、正確に「連鎖」を見つけ、ノイズにも強い頑強なアルゴリズムになっています ✔️ 実世界のデータで定性評価、合成データで定量評価し、優れた性能を確認しています Robust Time Series Chain Discovery with Incremental Nearest Neighbors written by Li Zhang, Yan Zhu, Yifeng Gao, Jessica Lin (Submitted on 3 Nov 2022) Comments: ICDM 2022 Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Information
時系列のアプローチ 単系列 ざっと見る 定常性の確認 ARIMA/SARIMAモデルをあてはめる 複数系列の関係→VAR(ベクトル自己回帰)モデル その他の変数がある(時系列+回帰)→状態空間モデル (単なるラグ変数回帰→目的変数自体の時系列性が反映されない) ライブラリ{forecast}を使う 以下、データはy.tsとする 時系列のデータ形式 時系列データにはいくつかの形式がある。 ts: Rの基本の時系列オブジェクト。ほとんどの時系列ライブラリはこの形式の時系列データを扱う xts: データフレームとtsの間に位置づけられる、時系列データを便利に扱えるようにした形式 zoo: データフレームとxtsの間の形式 われわれが一般的に扱うデータ形式はデータフレームで、時系列データも元はCSVやデータベースなどからデータフレームの形式で与えられることが多い。たとえば日付を表す列と値の列がそれ
私が個人的に開催しているエンジニア勉強会の2019年Advent Calendarで、『統計初心者がベイズ統計学に入門するまでの勉強法』という記事を書いたら、とても好評でした。 そこで今回は、統計初心者が時系列分析を学ぶための勉強について書いていければと思います。 この記事の目的と対象者 この記事は、統計の基礎はある程度勉強したことがあるという人が、立派に「時系列分析」統計学の一大トピックについて語れるようになることを目指します。 時系列分析の全体像を語れるようになるぐらいまでがこの記事のゴールです。 時系列分析の中でも、状態空間モデルという分析モデルを理解できるようになるところまでをゴールとします。 (そもそも統計モデリングってなに?という方は、こちら『結局、統計モデリングとは何なのか』もどうぞ) ここで紹介する書籍は、プログラミンを手を動かして学べる系の書籍ですので、プログラミングの知
【時系列分析/Python】statsmodelsライブラリのDeterministicProcess関数を使用して、売上予測をする。Pythonデータ分析時系列解析時系列データデータサイエンス 今回の課題 KaggleのTrendというチュートリアルでstatsmodelsライブラリを使用して、 未来の数値の予測が行われていた。 そのチュートリアルを参考に、 前回投稿した下記の記事の、未来の売上予測を行いたかった。 https://qiita.com/Ayumu-y/items/a2f3f716706a6f34028b statsmodelsライブラリとは 統計モデルを用いて推定や検定、探索ができるPythonライブラリ。 statsmodelsライブラリの中にDeterministicProcess関数があり、 この関数を使用することで未来の数値の予測ができる。 ※公式ドキュメントはこ
はじめに こんにちは。エンジニアの石井です。 前回から1年半ほど経ち、2回目の投稿ととなります。 今回はLogServiceで実現できる教師なしMLについて主に扱います。 ほんの一部の説明のみですが、多少なりとも使い方のイメージを掴んでもらえると嬉しいです! www.alibabacloud.com 事前の用意 今回はAR(2)過程、つまりに従う人工データを作成して利用します。*1 何回か生成するので、ここでは生成用の関数を定義しておきます。 gistedaab09029043c429a32c11083c0d6ae また、データのアップロードは大容量データの場合OSSやDataIntegrationを利用すると良いですが、今回は大変軽いデータなので、Pythonから直接アップロードします。 スクリプトサンプルはこんな感じです。(SDK等必要なものは別途インストール済みであるとします) gi
これはMYJLab Advent Calendar 2019の14日目の記事です。 こんにちは 宮治研究室に所属する学部3年、サッチーと呼ばれています webとか機械学習は周りのつよつよな方々が書いてくださるので、私は統計っぽいことを書きます 今回は すること Pythonのライブラリであるstatsmodelsを用いて時系列分析の基本であるBox-Jenkins法を用いた分析の一連の流れを実装していきます。 時系列分析はPythonの文献がなぜか少ないのが悲しいので、Pythonで時系列分析入門したい人のお役に立てれば幸いです。 しないこと 長くなってしまうので定常過程や単位根検定の種類等、手法の細かい説明は省きます。あくまでも実装メインで進めていきます。理論部分は有名なlogics of blueさんのものがとても優しくてわかりやすいかと思います。 statsmodelsとは 統計モデ
※ここでは疑似相関を考慮していない。 これら2つの時系列の因果関係を推定する際、その方法は大きく3つあげられる。 ・VARLiNGAM ・Granger因果 ・CCM 生物学・生態学分野において、そのデータは決定論的なものである。その際、各時系列変動は線形性を有するものは少なく、大抵は非線形な力学系を有する。よって、既存の「モデルリング→処理・推定」を実行することは、モデルフリーな推定よりも正確性が落ちる可能性がある。CCMは数式を仮定せず、時系列の観測値のみから系の状態空間を再構成して挙動を解析する手法である。この手法は2012年にScienceで発表されたものである。今回はこのCCMについて理解を深める一助とする。 CCMの大まかな例 2変数XとYが$ X_t=f(X_{t-1}) $、$ Y_t=g(X_{t-1}, Y_{t-1}) $に従う時、XがYに一方的に影響を与える(X→Y
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く