Numerai is an attempt at a hedge fund crowd-sourcing stock market predictions. It presents a Kaggle-like competition, but with a few welcome twists. For one thing, the dataset is very clean and tidy. As we mentioned in the article on the Rossmann competition, most Kaggle offerings have their quirks. Often we were getting an impression that the organizers were making the competition unnecessarily c
予測モデルのコンペで使われているStackingという手法に関して。 モデルをEnsembleしまくって、マルチステージモデルにして予測精度を高めるときに使われる手法とのこと。 実務家な私も、業務でマルチステージモデル(2ステージ)を組む必要があったので、そのためのメモ。 kaggleなどで発明され、まだ教科書にはなっていない方法論のようで、以下を参照。 KAGGLE ENSEMBLING GUIDE 具体的には以下のような課題(データ)があった。 目的変数y(0,1のBinomial)、説明変数rとXでモデルを作りたい。 rは個々のセールスマンを示すようなカテゴリカルデータで、変量効果として扱いたい。 Xは営業日誌のようなテキストデータから単語抽出して、TF-IDF変換した横長なデータ。 混合モデル(Logistic GLMM)を作成したいが、横長なXをそのままロジスティックモデルの変数
ChainerでSlack用のbot作成!! 注意:chainer 1.5.1以降のバージョンで動作を試みるとSegmentation faultのバグが出ます で1.5.1をインストールしてください。 突然ですが、あなたはこんな衝動にかられたことはないでしょうか? Slack上で面白い返事やつぶやきをしてくれるbotやいろんな質問に答えてくれるボットがいれば、会話が盛り上がるし、聞きづらい質問にも答えてくれるのに・・・ 私も思ったことがあります。そこで実装してみました。 最終的にこんな感じの応答を返してくれるようになります。 対象読者 1:中身は分らなくも良いから賢くなるbotを作ってみたい!! やるべきアクション:下記リポジトリをgit cloneして環境構築して、実行して下さい!! 2:中身も知って賢くなるbotを作ってみたい!! やるべきアクション:この記事を読んで仕組みを理解して
Update: This article is part of a series. Check out the full series: Part 1, Part 2, Part 3, Part 4, Part 5, Part 6, Part 7 and Part 8! You can also read this article in Italiano, Español, Français, Türkçe, Русский, 한국어 Português, فارسی, Tiếng Việt or 普通话. Giant update: I’ve written a new book based on these articles! It not only expands and updates all my articles, but it has tons of brand new co
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く