[B! predict] mahler-5のブックマーク

mahler-5 id:mahler-5

predictに関するmahler-5のブックマーク (6)

RPubs - Time series forecasting using machine learning
mahler-5 2019/03/06
R

predict

xgboost

あとで読む
リンク
Time Series Analysis for Business Forecasting with Artificial Neural Networks
mahler-5 2019/03/06
R

predict

deep learning

あとで読む
リンク
[R] 予測モデルを作るには formula を活用せよ - ill-identified diary
概要 formula オブジェクトは変数変換や交互作用項など, 多彩な表現ができる. xgboost や glmnet では model.matrix() を併用することで formula を利用できる. 統計モデリング/機械学習で予測モデルを構築するとき, 予測性能の向上のため, しばしば変数を入れ替えたり, 変換したりといった推敲が必要となる. R ではこういうときに formula オブジェクトを使うと, いちいちデータフレームに変換後の数値を追加したり書き換えたりする必要がなくなる. glmnet や xgboost など, formula が直接使えないものでも model.matrix() 等を併用すれば可能である*1. formula オブジェクトを解説した記事を探すと, かなり前から存在する. 例えば以下の記事. m884.hateblo.jp なお, 上記はタイトルが「f
mahler-5 2018/07/07
xgboost

あとで読む

predict

R
リンク
Python LSTM (Long Short-Term Memory Network) for Stock Predictions
Data Visualization Now let's see what sort of data you have. You want data with various patterns occurring over time. plt.figure(figsize = (18,9)) plt.plot(range(df.shape[0]),(df['Low']+df['High'])/2.0) plt.xticks(range(0,df.shape[0],500),df['Date'].loc[::500],rotation=45) plt.xlabel('Date',fontsize=18) plt.ylabel('Mid Price',fontsize=18) plt.show() This graph already says a lot of things. The spe
mahler-5 2018/06/09
Keras

RNN

python

predict

deep learning
リンク
Predictive Sales Analytics: Use Machine Learning to Predict and Optimize Product Backorders
If we take a look at the distribution of the target, train_raw_df$went_on_backorder, we see that the data set is severely imbalanced. We’ll need a strategy to balance the data set if we want to get maximum model performance and efficiency. # Unbalanced data set train_raw_df$went_on_backorder %>% table() %>% prop.table() ## . ## No Yes ## 0.993309279 0.006690721 We can also inspect missing values.
mahler-5 2017/11/03
R

deep learning
リンク
同じデータセットに対するアプローチの違いから見る「データ分析のステージ」 - 渋谷駅前で働くデータサイエンティストのブログ
追記 (2015/02/21) いくつか抜けてるところがあったなぁと思ったので、後から追記や加筆修正してみました。最初のオリジナル版から少し内容が変わっているところがありますがご了承ください。ちょっと前の記事でこんなネタをやってみたわけですが。世の中には色々な「データ分析」のやり方があるなぁと思った時に、この同じ2013年のテニス四大大会のデータからそれぞれのやり方をしている人たちがどんな異なるアプローチを取るのかなぁとふと想像したもので、半分ネタ的に書いてみました。便宜的に以下のようにステージを分けてあります。集計ステージ検定ステージ相関ステージ重回帰分析ステージ機械学習を含めたモデリングステージ厳密性に拘るステージなお、データは以前の記事と同じこちらのものをお使い下さい。その上で、Rで分析する際は以下のように前処理しておきます。単にプレイヤー名・獲得ゲーム数・総獲得
mahler-5 2016/09/28
predict

R
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx