タグ

2010年8月31日のブックマーク (4件)

  • トピックモデル入門編 - yasuhisa's blog

    自然言語処理特論も最後の話題、トピックモデルに先週から入ってます。今日の資料はこの辺の最初の付近。 Topicに基づく統計的言語モデルの最善線 前々回までの内容は最尤推定に基づいていたものがほとんどで、(ベイズ的な流れではない)スムージングの方法の説明などがあっていました。 Good-Turing 線形補完 Kneser-Ney smoothing などなど。あとは最大エントロピー法などですね。 なんでトピックモデルなのか?で、こういう方法があるにも関わらずなんでトピックモデルというのがわざわざ出てくるか。それは、単語の出現確率というのは変動しまくる!という現実があるからのようです。例えば、最尤推定に基づくN-gramでは、文章に関わらず真の出現確率というのがあると想定している。しかし、Unigramを考えているとして、「東証」という単語が出てくる確率は、社説、経済、スポーツ、芸能などでは

    トピックモデル入門編 - yasuhisa's blog
  • 行列分解ライブラリredsvdを公開しました - DO++

    大規模疎行列向けの行列分解ライブラリredsvdを公開しました. redsvd 大規模疎行列向けの特異値分解や主成分分析,固有値分解を行うライブラリredsvdを公開しました. 修正BSDライセンスで公開しており,コマンドラインから使える他,C++ライブラリが用意されています. 例えば,行と列数がそれぞれ10万,非零の要素が1000万からなる疎行列に対する上位20位までの特異値分解を約2秒で処理します. 特異値分解とか,使っている技術の詳細とか応用事例を以下に簡単に紹介しましたので,興味のある方は参考にしてください. 特異値分解とは まず行列を適当に復習します.行列Xの転置をX^tと表すことにします.またIを単位行列とし,Oを全ての成分が0である零行列とします.また,行列XX^t=IであるようなXを直交行列と呼びます.Xが直交行列の時,Xvはベクトルvを長さを変えずに回転させます.ここでは

    行列分解ライブラリredsvdを公開しました - DO++
  • 就活で採用されるために必要なたった1つのこと -アップル本社社員インタビュー 

    はじめに このたび、外資就活はApple社内で、4名のアップル社社員の方々へのインタビューを行うという貴重な機会を得ました。 インタビューを行ったapple社は、まるで大学のキャンパスのように広く美しい場所でした。 社員もシャツにジーンズといった服装でキックボードやスケボーで移動していたり、かなりフリーダムな雰囲気です。 このような場所だからこそ、クリエイティブな製品が次々に生まれていくのかもしれません。 今回、デザイン等の機密事項以外であれば掲載しても良いとの許可を頂きました。そこでアップルの職場環境や採用情報、就活成功の鍵についてのインタビューの模様をお伝えしたいと思います。(※2010年夏収録) 自分の守備範囲を1歩越えて仕事をできる人が求められている ―まずは、アップルという企業の環境について、どう思われているかお聞かせください。 ◆アップルは私達エンジニアにとって最高といっ

    就活で採用されるために必要なたった1つのこと -アップル本社社員インタビュー 
    tettsyun
    tettsyun 2010/08/31
  • ネタベタオタの上には - 書評 - メタプログラミングRuby : 404 Blog Not Found

    2010年08月24日23:45 カテゴリ書評/画評/品評Lightweight Languages ネタベタオタの上には - 書評 - メタプログラミングRuby 出版社より献御礼。 メタプログラミングRuby Paolo Perrotta / 角征典 [原著:Metaprogramming Ruby] 「ただの」プログラマーで終わりたくない人、必携。 Rubyistsはもとより、そうでない人も。 むしろRuby以外のプログラミング言語をホームグラウンドにしている人は、Rubyistsよりもさらに得るところが大きいかもしれない。「私の言語ではどうやる?」を考え、実際にやってみることで、Rubyも「母国語」も理解が深まるのだから。 書「メタプログラミングRuby」は、Rubyにおけるメタプログラミングを物語形式で学ぶ一冊。舞台はRubyを使っているある会社。平凡なプログラマー、ボブは、

    ネタベタオタの上には - 書評 - メタプログラミングRuby : 404 Blog Not Found