タグ

2010年4月7日のブックマーク (2件)

  • Boostingの並列化 - 射撃しつつ前転 改

    パターン認識と学習の統計学のp.153に「バギングは並列化が可能であるので、並列計算機を用いることによって計算時間を大幅に短縮できるが、ブースティングは逐次的にしか計算できないので、計算時間は生成する弱仮説の数に比例して長くなることになる」と書いてあったので、ブースティングって並列化できないんだなぁ、と思っていたんだけれど、こないだAdaBoostをちょっと真面目に考えてみたら、弱学習器を選べば並列化が可能な場合もあるという事に気づいた。 そもそも、よく読んでみると、パターン認識と学習の統計学には「ブースティングは並列化できない」とは一言も書いていない。これは実は意図的だったりするんじゃないかと思う。「生成する弱仮説の数に比例して計算時間が長くなる」というのはまったくその通りで、データの重み付けを逐次的に変更しながら学習を繰り返すというAdaBoostの仕様上、これはどうしようもない。ただ

    Boostingの並列化 - 射撃しつつ前転 改
  • フィッシャーとベイズを軽く試す - 元データ分析の会社で働いていた人の四方山話

    僕は情報工学を選考してきた学生ではあるが、残念ながら大学の意味不明なカリキュラムにより,統計確率は必修ではないため、学部自体に確率についてまともに勉強する機会がなく、当然の事ながら大学院入試でも統計確率が試験科目としてなかったため、必要になった時につまみい的に統計確率を学ぶ程度で、実は情報系を選考している大学院生であり4月から統計確率バリバリの金融工学な世界に足を踏み入れるのにも関わらず、恐ろしく統計確率の知識が希薄であるというありえない状況である。これはまずいなー、と思っていたところ、証券アナリストの勉強やら何やらで統計確率に触れる時間が増え、読み物的な確率のから学習をしていってるので、適宜アウトプットしていこうと思います。 何か同僚のブログのコメント欄で紹介されていたを買って読んでみています。確率的発想法~数学を日常に活かす NHK出版 2004-02-29 売り上げランキング