[B! MapReduce] tettsyunのブックマーク

tettsyun id:tettsyun

MapReduceに関するtettsyunのブックマーク (2)

Efficient Large-Scale Distributed Training of Conditional Maximum Entropy Models - tsubosakaの日記
新年明けましておめでとうございます。今年初の論文紹介。大規模なデータセットに対する条件付き最大エントロピーモデルの学習を並列で行う話[1]。論文概要条件付き最大エントロピーモデルの学習を並列でおこなうというタスクに関して、標準的な3通りの方法について比較を行った。そのうちmixture weight methodに関しては収束レートの理論的解析を行っているまた100万件から10億件までのデータセットに対して実験を行った。条件付き最大エントロピーモデル条件付き最大エントロピーモデルの詳細に関しては文献[2]などを参考にされたい。訓練データS={(x_1,y_1) , \dots , (x_m ,y_m)}が与えられたとする。ここでxは入力データ、yはクラスラベルだと思ってもらえればよい。素性ベクトルをとして、としたとき、解かなければならない問題はを最小化するwを求めることで
tettsyun 2010/01/15
ME

machinelearning

MapReduce
リンク
Disco MapReduce
Disco is a lightweight, open-source framework for distributed computing based on the MapReduce paradigm. Disco is powerful and easy to use, thanks to Python. Disco distributes and replicates your data, and schedules your jobs efficiently. Disco even includes the tools you need to index billions of data points and query them in real-time. Disco was born in Nokia Research Center in 2008 to solve rea
tettsyun 2009/06/15
python

Erlang

MapReduce
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx