タグ

ブックマーク / gemma.hatenadiary.org (2)

  • 検索インデックスを作ろう 後編 (Hadoopで転置インデックス) - Gemmaの日記

    Hadoopで転置インデックスを作る。 Hadoopのインストールについては以下を参照。 Hadoopのインストールとサンプルプログラムの実行 Running Hadoop On Ubuntu Linux (Single-Node Cluster) 転置インデックスとは、の巻末にある索引のことだ。 例えば、るるぶは巻末に転置インデックスがついていて、目的地のページを素早く探せる。 "金閣寺 ・・・ P.15" "銀閣寺 ・・・ P.15,P.16,P.57" "高台寺 ・・・ P.11" 前編の単語リストは、文書ID => 単語、単語、単語 だったが、 後編の転置インデックスは、単語 => 文書ID、文書ID、文書ID と、 単語リストをひっくり返す(転置)。 MapReduceの手順 1.文書のURIを並べたテキストファイル http://localhost/rfc/rfc1.txt

    検索インデックスを作ろう 後編 (Hadoopで転置インデックス) - Gemmaの日記
    J138
    J138 2009/06/12
  • 関数型言語って何がすごいんですか - Gemmaの日記

    C使いの人に、 関数型言語って何がすごいんですか と聞かれて、 じゃあC言語で accumulator すなわち、数nをとり、「数iを取ってnをiだけ増加させ、その増加した値を返す関数」を返すような関数を書いてみろよ って言ったら、 値を返す関数を返すような関数・・・? オンドゥルルラギッタンディスカー で、会話が続かない。 さらに、C使いのターン。 関数に関数を渡せる? Cだって関数ポインタ渡せますよ。 チューリング完全なんだから、どんなプログラムだって書けますよ。 と仕掛けてきた。そこで、 じゃあ、3回呼ぶと動作が変わる関数を書いてみて。 f(); f(); f(); f(); と呼ぶと、 3 2 1 liftoff って出力されるやつ。ロケットみたいな。 できました。 #include <stdio.h> void f() { static int count = 3; if (co

    関数型言語って何がすごいんですか - Gemmaの日記
  • 1