タグ

2011年5月29日のブックマーク (6件)

  • 超簡単な半教師ありナイーブベイズ - nokunoの日記

    ICMLにこんなの通るんだ、と思った論文。Large Scale Text Classi¯cation using Semi-supervised Multinomial Naive Bayes ナイーブベイズでP(c|d)∝P(c)Π_i P(w_i|c)を求めるときに、もう一回ベイズの定理を適用してP(w_i|c)=P(w_i)P(c|w_i)/正規化項 と変形してやってP(w_i)はラベル無しデータで、P(c|w_i)はラベルありデータで推定するというシンプルな手法 ラベル付きデータが64〜512個と極端に少ない 識別モデルと比較していない でもGoogle N-gramなどの汎用の言語モデルが使えるので実用上は便利そう 教師ありNBやEMアルゴリズムによる半教師あり学習より大幅に精度向上参考:ICML2011気になった論文リスト - kisa12012の日記ツイートする

  • 単語と文字の話 - Preferred Networks Research & Development

    4月からPFIで働いてます。海野です。 今日は単語の話をします。読み物的な話なので軽く読んでください。 テキストデータなどの自然文を機械処理するときには、まず最初に単語に分割するということをよく行います。一般的にはMeCabやChasenといった形態素解析エンジンに投げて行います。形態素と単語の区別という話もあるのですが、ここでは大雑把に「連続した文字列の単位」くらいの意味で話します。 検索という文脈ですと形態素インデックスという言葉がありますが、これは検索の最小単位を文字単位ではなくて形態素の単位にするということです。例えば「東京都」は「東京」「都」に分かれるため、「京都」というクエリに対して見つかるのを防ぐなど、精度を上げる効果があります。反面、深刻な検索漏れを引き起こす可能性があるため嫌われることが多いです。こうした漏れは検索に限らず、テキストマイニングなどの文脈でも問題となることが

    kshimo69
    kshimo69 2011/05/29
  • MacBookAir3-2/Narwhal - Community Help Wiki

    General These instructions cover the late 2010 MacBookAir3,1 and MacBookAir3,2 models. Most of the information in this article is derived from the Ubuntu Forums. Installation Installation works using the Apple Superdrive, additional steps may be required for other installation methods, such as these for an USB stick method. Use the Intel CPU-based Macintosh Generic Installation Instructions. But,

    kshimo69
    kshimo69 2011/05/29
    そんなことできるのかー
  • Apps/Anjuta - GNOME Wiki!

    About Anjuta Features a number of advanced programming facilities including project management, application wizard, interactive debugger, source editor, version control, GUI designer, profiler and many more tools. Focuses on providing simple and usable user interface, yet powerful for efficient development. It supports the following programming languages: C, C++, Java, Javascript, Python, Vala New

    kshimo69
    kshimo69 2011/05/29
  • 7分半で作るNode.js+MongoDBアプリ - PolyPeaceLight

    先日のJJUG SpringのLTをしてきた「7分半で作るNode.js+MongoDBアプリ」の動画を撮り直しました。 番ではmongoose.Schemaのところをmongoose.modelとしてしまい、まさかのライブデバッグを初めるハメになり、結果として13分となってしまいました。 リベンジとして今日何回かトライしたところ10分を2分半も上回る7分半、スリークォーターの記録を出すことができました。 動画中でやってること 1 環境を証明 nvmとかnodeとかnpmとかがインストールされてないことを証明 env.shは確認するコードが書かれているだけです 2 nvmとmongodbをググる 3 nvmをgitで取得 $ git clone git://github.com/creationix/nvm.git ~/.nvm 4 nvmを環境に読み込む $ . ~/.nvm/nvm.

    7分半で作るNode.js+MongoDBアプリ - PolyPeaceLight
  • JavaScript Guides - Touch Support | DHTMLX Suite 8 Docs

    Touch support Since version 7.0 and upper, the dhtmlxSuite library provides the built-in Touch support that should work out of the box. As a result, the interaction with the DHTMLX-based apps on touch devices becomes more comfy and predictable. While interacting with applications by touching the screen, a tap becomes the same thing as a mouse click. Thus, the click events (fire on clicking, double