2014年4月16日のブックマーク (2件)

  • The Waf Book

    ソフトウェアの複雑化に伴い、ソフトウェア作成のプロセスもさらに複雑になってきている。 今日のソフトウェアは様々な言語、コンパイラ、多くの分散した入力データファイルを必要とする。 ソフトウェアは今やソフトウェアのビルドプロセスを表現するのに用いられており、それは簡単なスクリプト(シェルスクリプトやMakefile)やコンパイラ(CMakeやQMake)、完全なアプリケーション(SCons, Maven, Waf)の形態である。 ビルドシステムという用語は、アプリケーションのビルドに用いられるツールの設計、として使われる。 ビルドシステムはビルドするソフトウェアに関していくつかの想定をし、異なる言語やプロジェクトをビルドする際にそれらの想定は典型的に限定される。 例えば、AntはMakeよりもJavaプロジェクトにおいては適しているが、単純なC言語のプロジェクトの管理に関してはMakeよりも

    ttsurumi
    ttsurumi 2014/04/16
  • MinHashによる高速な類似検索 - Preferred Networks Research & Development

    年が明けてもう一ヶ月経ちましたね.岡野原です. 今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている). 今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を並べた単語空間ベクトル(Bag of Words)で表し,画像データも,SIFTをはじめとした局所特徴量を並べた特徴ベクトル(とそれをSkecth化したもの)として表せます.行動情報や時系列データも特徴量をうまく抽出する.グラフデータもFast subtree kernels[1]と呼ばれる方法で非常に効率的に特徴ベクトルに変換することができ,グラフの特徴をよく捉えることができるのが最近わかっ

    MinHashによる高速な類似検索 - Preferred Networks Research & Development
    ttsurumi
    ttsurumi 2014/04/16