個別株のリターン 今回は個別銘柄の株価のリターン予測についてです. 初めにリターンを定義します.昨日($t-1$時点)の株価の終値$S_{t-1}=$1,000とし,$X_{t-1}=$100万円で株式を購入したとすると,$\frac{X_{t-1}}{S_{t-1}}=$1,000株の株式を保有したことになります. 今日の株価の終値$S_t=$1,020とし,全部売却すると,$\frac{X_{t-1}}{S_{t-1}}\times S_t=$1,000$\times$1,020=102万円を取得し,$\frac{X_{t-1}}{S_{t-1}}\times S_t - X_{t-1}$=102万円-100万円=2万円の収益になります. $\frac{X_{t-1}}{S_{t-1}}\times S_t - X_{t-1}=X_{t-1} \times ( \frac{S_t}{S
GARCH GARCH GJR EGARCH Duan Duan t GARCH GJR EGARCH GARCH GJR EGARCH GARCH GJR t E-mail: twatanab@bcomp.metro-u.ac.jp Black and Scholes BS Engle ARCH autoregressive conditional heteroskedasticity Bollerslev GARCH generalized ARCH GARCH GARCH Black Christie GARCH Glosten Jagannathan and Runkle GJR Nelson EGARCH exponential GARCH GARCH t Bollerslev, Engle and Nelson Watanabe t GARCH Duan locally ris
この頁は、平成27年2月15日に新たに開設しました。 この頁は、平成28年10月27日に一部更新しました。 1.1 時系列解析の研究の歴史 伝統的な時系列の解析は、Yule (1927) の自己回帰モデル (autoregressive model), 以下 AR と略す)に始まり、移動平均モ デル (moving average model, MA)、自己回帰移動平均モデ ル (autoregressive moving average model,ARMA) などのいわゆる 線形時系列解析よりなされてきた(例えば合原、2000)。また、同解析による時系列 信号の基本的な特性は、自己相関関数 (autocorrelation function)、 自己相関係数 (autocorrelation coefficient)、パワースペクトル (power spectrum) などを用いてなさ
中盤はテクニカルな話題なので、統計や経済に馴染みのない人は読み飛ばして最後だけ読んでください 金融関係のレポートを見ていると、よく相関係数の変化を示すグラフが登場します。 (zero hedge http://www.zerohedge.com/news/2014-12-30/spot-difference) (日銀「最近の株価と為替の同時相関関係の強まりについて」) だいたいの場合において、こうした相関係数はその地点の前100日〜500日くらいの期間をとってヒストリカルな相関(sample correlation)をローリングして可視化するだけといった簡単なものになっています。 統計的推定の文脈でいうと、これはfiltering(過去のデータのみを用いてその地点の真の値を推定する)で得られる値に近く、smoothing(後のデータも加味して後だしじゃんけんで推定する)ではありません。 予
6年ほど前にクルーグマンとマンキューの単位根を巡る議論を紹介したことがあったが、同様の議論が再燃している。きっかけは、ロジャー・ファーマーの4/16エントリ。そこでファーマーは、1955第1四半期〜2014年第4四半期の実質GDPの対数値を定数項とタイムトレンドに回帰し、その残差について検定を行っている。 彼はまず、その残差を一期ラグに回帰し、回帰係数が0.996447と1に近いことを示した。しかしそれだけでは単位根を持つとは言えないので、拡張ディッキー=フラー検定とKPSS検定の2種類の検定を行ったところ、前者では単位根を棄却できず、後者では定常性が棄却されたという*1。この結果についてファーマーは、失業率が単位根を持つことを示した自分の論文を引きつつ、失業率が高い水準を持続し得るのと同様に、GDPもトレンド以下の水準を持続できるのであり、経済が自己修正的であるという証拠はない、と結論付
今日質問されて、以前Twitterで書いたのを思い出して、そして検索性が悪くて見つけ出すのに苦労した。こちらに転載しておく。詳細は気が向いたときに埋める。 オプション引数の評価タイミング Rubyではオプション引数は関数が呼ばれるたびに評価される。 def foo() print "foo!" end def bar(x=foo()) end bar #=> foo! と出力される bar #=> foo! bar #=> foo! Pythonでは関数の定義時に1回だけ評価される。 def foo(): print "foo!" def bar(x=foo()): pass #=> foo!と出力される bar() #=> 何も出力されない bar() 「引数が省略されたら今の日時」みたいな毎回評価したい場合はデフォルト値をNoneにしておいて「Noneだったら=省略されていたら」のif
HTML の表をスクレイピングするのは結構だるい作業です。 私は以前は、単純な HTML であれば、うまく特徴を見つけて awk や sed を作ったり、 Perl の正規表現で取り出したり、 Google Chrome のコンソールから XPath を使って取り出すような苦労をやっていました。 ところで pandas というとデータ解析用のツールとして主流ではあるのですが、 意外にも HTML からのデータ入力も可能になっていて、これが表のスクレイピングにはかなり楽だということがわかりました。 なので紹介してみます。 サンプルに使うページ 以下で示すサンプルに国税庁の所得税の税率のページを使うことにしました。 https://www.nta.go.jp/taxes/shiraberu/taxanswer/shotoku/2260.htm (2019.9.28 移転したようなので、URLを
前回の記事:投資信託「eMAXIS」のデータを分析する−1(データ取得関数作成編) - My Life as a Mock Quant 前回書いたeMAXISのデータ取得関数をもうちょっと使いやすいように書き換えた。そしてついでにPerformanceAnalyticsパッケージの使い方を覚えたかったのでこのデータを分析してみたという内容。以下のサンプルコードでは xts PerformanceAnalytics パッケージを使用するので、それは別途インストールしておく必要がある。まずはデータ取得関数 library(xts) library(PerformanceAnalytics) #eMAXISのファンドデータを取得 GeteMAXIS <- function(){ #各資産の列名(英語),順に以下のものの略 #基準日:Date #基準価額 : Constant value #基準価
「eMAXIS」という手数料の安い素晴らしいインデックスファンドを三菱UFJ投信さんが出しておられてて、サイトをよくみると今までの基準価額がcsvで取得できるようになっているではないか!…ということでそれを自動的に引っ張ってきてRのデータに倒す関数書いた。ついでに最近の地震の影響が金融市場にどの程度影響を与えているのかも見てみる。現時点(2011/4/7)では eMAXIS 日経225インデックス eMAXIS TOPIXインデックス eMAXIS 国内債券インデックス eMAXIS 国内リートインデックス eMAXIS 全世界株式インデックス eMAXIS 先進国株式インデックス eMAXIS 先進国債券インデックス eMAXIS 先進国リートインデックス eMAXIS 新興国株式インデックス eMAXIS 新興国債券インデックス という合計10投資信託のデータが取得可能。まずデータ取得
AIC とは 1. AIC を知ると何が嬉しいか 以下のようなデータが得られていたとして,多項式モデルを当てはめることを考え てみましょう: y = ¯0 + ¯1 x + ¢ ¢ ¢ + ¯k xk + "; " » N (0; ¾ 2 ): y (xi ; yi ) ( xn ; y n ) (x2 ; y2 ) (x1 ; y1 ) x 最初に未知のパラメータ µ = (¯0 ; ¯1 ; : : : ; ¯k ; ¾ 2 ) を特定しなければなりません.手持ち のデータ f(xi ; yi ) : i = 1; : : : ; ng を利用して,最尤法によって推定することにしましょ b う.得られた推定値を µ で表すことにします.結果的に以下のモデルを提案できたわけ です: ^ ^ ^ y = ¯0 + ¯1 x + ¢ ¢ ¢ + ¯k xk + "; " » N
Commandeur & Koopman「状態空間時系列分析入門」をRで再現する 仕事の都合で仕方なく状態空間モデルについて勉強していたのだけれど(なぜ私がこんな目に)、仕事で使うためには自分で計算できるようにならなければならない。 参考にしているCommandeur & Koopman 「状態空間時系列分析入門」(以下「CK本」)の著者らは、すべての事例についてデータとプログラムを公開している。ありがたいことであります。しかし、ssfpackという耳慣れないソフトを使わなければならない。わざわざ新しいソフトの使い方を覚えるのは大変に面倒だ。できれば普段使っているソフトで済ませたい。 というわけで、勉強かたがた、CK本に出てくる計算例を片っ端から R で再現してみた。汗と涙の甲斐あって、すべての章についていちおう再現できたので、ここに載せておくことにする。 もくじ: Rプログラム紹介 全体
主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま
概要 前回 大数の法則の視覚化から理想の推定量を考える - ill-identified diary の最後に上げた具体例の, 時系列分析の場合についても, 推定量の違いから生じる結果を視覚化してみた. 時系列はあまり詳しくないので操作変数編より内容が薄い. 安定な自己回帰 (AR) モデルと, 自己回帰移動平均 (ARMA) モデルの場合のみ. 時系列分析の話なのでそれなりに数式が出てくる. AR・ARMAモデルの基本的な話は, 日本語なら 沖本 (2010, 経済・ファイナンスデータの計量時系列分析) とか Rで計量時系列分析:AR, MA, ARMA, ARIMAモデル, 予測 - 六本木で働くデータサイエンティストのブログ とかを参考に. もう少し詳細厳密な話が知りたい場合は, Hamilton (2006, 時系列解析 (上) 定常過程編), Hayashi (2000, Eco
対数尤度が合わないとAICやBICといった値も必然的に合わなくなると思われるので、けっこう困った話になる。 今回はずれるという事象だけをメモしておく。気が向いたらなぜずれるのかを検証してみるかもしれない。 回帰式は例によってこれ。 Pythonで作ったデータをstatsmodels.OLSに突っ込むのとあわせて、csvファイルに出力して、Rで読んでlmに食わせる。 まずはPythonのコード。 # -*- coding: utf-8 -*- import matplotlib.pyplot as plt import numpy as np import seaborn as sns import statsmodels.api as sm #サンプリング数 N=1000 #データ生成 np.random.seed(0) x=np.random.normal(1,1,N) eps=np.r
Pythonは機械学習周りのパッケージは充実している感じがあるのですが、どうにも統計周りのパッケージが不足している感じがあって、PythonからRを叩くパッケージを試してみることにしました。 PythonからRをつかうパッケージとしてはRPy2が有名っぽいですが、 There is currently no binaries or support for Microsoft Windows (more for lack of ressources than anything else). とのことで・・・ 試しにeasy_installでインストールしてみましたがエラーが出てインストールできなかったので、違う方法を試すことにしました。 PythonからRを使いたい -だがRPy2おめーはダメだ- - 盆栽日記を見てPypeRのほうを試すことにしました。 インストールはいつもどおりeasy_
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く