タグ

2008年7月8日のブックマーク (3件)

  • GoogleのMapReduceアルゴリズムをJavaで理解する

    GoogleMapReduceアルゴリズムをJavaで理解する:いま再注目の分散処理技術(前編)(1/2 ページ) 最近注目を浴びている分散処理技術MapReduce」の利点をサンプルからアルゴリズムレベルで理解し、昔からあるJava関連の分散処理技術を見直す特集企画(編集部) いま注目の大規模分散処理アルゴリズム 最近、大規模分散処理が注目を浴びています。特に、「MapReduce」というアルゴリズムについて目にすることが多くなりました。Googleの膨大なサーバ処理で使われているということで、ここ数年の分散処理技術の中では特に注目を浴びているようです(参考「見えるグーグル、見えないグーグル」)。MapReduceアルゴリズムを使う利点とは、いったい何なのでしょうか。なぜ、いま注目を浴びているのでしょうか。 その詳細は「MapReduce : Simplified Data Proc

    GoogleのMapReduceアルゴリズムをJavaで理解する
  • おまけ for GNU Emacs

    かなり以前から eblook/Lookup のテストのために Emacs をインストールしていましたが、どうしても馴染めないまま数年の月日が過ぎてしまいました。が、とある事情で Wanderlust を使いたくなり、少しずつ Emacs に慣れようとしている今日この頃なのです。 と書いてからさらに数年。少しは慣れたような、でもたいして進歩していないような。 jaspace.el 仕事柄、日語の空白が表示されないと不安になる (というか結構困る) ので、練習も兼ねて、全角空白を薄い色の '□' として表示する minor mode を書きました。ついでに改行文字も表示できるようにしました。デフォルトでは、font-lock-mode が有効になっている場合にだけ機能します。代替文字や face は変更できます。こんなに冗長なことをしなくても、実用上は background だけ設定すれば十

  • まさかの日記:MSの某氏との会話ログ

    コンピュータサイエンス系の人たちの間では、サーチのテクノロジーで人気があるのはリリバンシー、次はバーティカルサーチ。 他の要素としては、クローリングとインデキシング、クラウド系というところらしい。 サーバをグリッド化(やや死語だな)して、、みたいなのは、コンピュータサイエンスというよりはエンジニアリング。 昔、シックスアパートの某Perlギークの人と話をしたとき、「自分はエンジニアリング系じゃないんで、、」と言っていた。そのときはエンジニアリングという言葉の定義がよくわからなかったけど、なんとなくわかってきたかも。 あ、全文検索とかマイニングとかも面白いといっていた。まあこれは要素技術だけど。Luceneを作った人が別で作ってる奴が結構良いって。なんだろ。SolrかHadoopか。 あと、エンタープライズサーチ。例えばメール。誰がどんな単語を多用しているかをサマリーしたり、検索させたり。

    まさかの日記:MSの某氏との会話ログ