Overview¶ 回帰問題は,入力 \(x\) に対応する特徴ベクトル \(\phi(x) \in R^m\) に対して,実数値の出力 \(y \in R\) を当てる問題である. 今回実装したのは,線形回帰モデルである. 線形回帰モデルでは,パラメータ \(w \in R^m\) を利用して,入力 \(x\) に対して \(\hat{y} = w^T \phi(x) \in R\) で予測する. 学習時には,分類問題同様,正解データセット \(\{(x_i, y_i)\}\) を利用して,正解データに対して正しく予測できるように重みベクトルを推定する. 典型的には1800年代に,予測値と実測値との自乗和を最小化させる最小二乗法が提案されている. この方法はバッチ処理になるため,今回の調査ではオンライン学習させる方法を利用した. Passive Aggressive¶ Passive A
昨日行われたJubatus Workshopに参加してきました。ref. 第一回 Jubatus Workshop #jubatus - Togetter JubatusOfficial Presentations 以下は僕の解釈も含めたまとめ ユバタスの必要性 データはこれからも増加していく。今多いってことより、今後どんどん増えるということが重要な問題 データの活用は 蓄積→理解→予測。世の中はようやく蓄積が出来るようになり理解に向かい始めた段階. CPUの速度が向上する速度よりも、データ量の増える速度の方が大きい。必然的にデータに対する処理で並列性を考えなければいけない状況が増えてくる。 既存のシステムとの差 既存のシステムでは 1. リアルタイム性の確保 2. データの水平分散処理 3. 高度な解析 の3つを兼ね備えることが困難。 MapReduceは処理の自由度は高いが基本的にバッ
Mixの概念¶ データの分析を行う際の分散処理環境の方式として、分析に使用するデータそのものを複数のサーバノード間で複製し・共有する方式を採用する場合、データサイズが膨大になります。 Jubatusでは、データそのものを共有するのではなく、分析に必要なモデル情報(データを分析した結果)のみを交換・共有する方式を採用しています。 一般的にモデル情報はデータそのものよりもはるかに小さいサイズで格納することが可能です。 Jubatusでは、このモデル情報を各ノードが格納し、データに基づいたモデル情報の更新を行います。また、そのモデル情報に基づくデータの分析を行います。 各サーバノードのみでモデル情報が更新される場合、各サーバノードのモデル情報には差異が生じます。そのため、各サーバーノード間でのモデル情報の交換と共有を行い、システム全体でモデル情報の更新を行う必要があります。 Mixとは、各サーバ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く