タグ

2011年2月9日のブックマーク (3件)

  • 大相撲のアノーマリー (1)

    大相撲の勝敗結果を分析すると、ちょっとした不自然さが見つかります。今回は、ベストセラーとなった書籍「ヤバい経済学」でも紹介されていた論文を元ネタにネット上のデータを利用して解析を試みます。 今回の前口上 諸事情により2カ月の間連載を空けてしまいました。申し訳ございませんでした。実は10月、11月に用意した時事ネタがいろいろあるのですが、こちらは少しタイミングを逸して旬が過ぎたので、もう少し寝かせてから提示したいと思います。また、何人かの読者の方から励ましのお言葉を戴きまして大変感謝しています。当に励みになります。ありがとうございました。もしもこの連載で取り上げてほしい問題やネタ、改善点などがありましたら、遠慮なく以下のメールアドレスにリクエストやご意見をお送りください。 knife@bakfoo.com 今回から数回は、大相撲の統計データをネタにして、「公になっているが混乱しているデータ

    大相撲のアノーマリー (1)
  • MinHashによる高速な類似検索 - Preferred Networks Research & Development

    年が明けてもう一ヶ月経ちましたね.岡野原です. 今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている). 今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を並べた単語空間ベクトル(Bag of Words)で表し,画像データも,SIFTをはじめとした局所特徴量を並べた特徴ベクトル(とそれをSkecth化したもの)として表せます.行動情報や時系列データも特徴量をうまく抽出する.グラフデータもFast subtree kernels[1]と呼ばれる方法で非常に効率的に特徴ベクトルに変換することができ,グラフの特徴をよく捉えることができるのが最近わかっ

    MinHashによる高速な類似検索 - Preferred Networks Research & Development
  • 本物の C++er はデストラクタを書かない - 野良C++erの雑記帳

    代わりに std::unique_ptr (あるいは boost::scoped_ptr )を使います. 何故か? struct hoge { hoge() : xxx( get_resource() ) { /* 処理 */ if( some_cond ) throw some_exception(); /* さらに処理 */ } ~hoge() throw(){ release_resource(xxx); } /* ... */ private: XXX xxx; }; このようなコードで,コンストラクタ中に例外が投げられた場合, デストラクタが呼ばれず,解放漏れが起きるからです. このような露骨な場合でなくても, struct hoge { hoge() : xxx( get_resource() ), yyy() // ここで例外! { } ~hoge() throw(){ re

    本物の C++er はデストラクタを書かない - 野良C++erの雑記帳