1. 2011/11/11 IBIS 2011:オンライン予測セッション オンライン凸最適化と 線形識識別モデル学習の最前線 株式会社Preferred Infrastructure 岡野原 ⼤大輔 2. 背景:⼤大規模、リアルタイムな分析の需要の⾼高まり l ⾼高次元で疎な⼊入⼒力力を扱う l 例例:⾔言語処理理の例例では、全単語の3つまでの組み合わせ〜~数百億次元、 ⾮非零零要素数は平均数百〜~数万 l ⾼高スループット、低レイテンシな分析が求められる l SNS分析、アルゴリズムトレード、広告配信など l 例例: ⽂文書分類の場合、秒間1万⽂文書程度度が⽬目標(SNSなど) l データは⼤大量量、モデルの種類数も膨⼤大 l 全て集めてから処理理というのは困難 l ユーザー毎に異異なるモデルを利利⽤用⇒分類器が数百万 3. 背景:⼿手法の発展 l