タグ

2011年3月22日のブックマーク (3件)

  • 多人数開発で Git を使う場合の環境構築 | GREE Engineering

    こんにちは、インフラやってる sotarok です。最近、社内でも「sotarok は そーたろっくと読む」という誤解が広がっていましたので改めて自己紹介しますと、sotarok と書いて「そーたろー」または「そーたろー・けー」と読みます。ロックしてないのでよろしくお願いします。 今日は、Git の話です。 GREE ではずっと Subversion を使っているという話を、以前開発環境の話をしたときに少し触れたことがあります。Subversion での運用方法も、GREE では割と面白い運用をしているのでその話もどこかでしたいのですが、まあ、それは今回は置いておきましょう。どこかで聞いてください。 GREE もその昔 CVS から Subversion に移ったのですが、時代は流れるもので、いよいよ Git 化という流れがきています。Subversion と Git の違いを今更あえて挙

    多人数開発で Git を使う場合の環境構築 | GREE Engineering
    mtoyoshi
    mtoyoshi 2011/03/22
  • Map/Reduce サンプルプログラム: おちエンのブログ

    Hadoop を install したので、Map/Reduce のサンプルプログラムを書いてみました。 Map/Reduce Tutorial に文字数をカウントするプログラムについての説明が載っているので、超初心者の自分でも簡単に書くことはできたのですが、いざコンパイルしてみると、deprecate の嵐。 deprecated でも動くことは動くんですが、そのうちなくなるであろうクラスを使うのも気持ち悪いので、deprecated でないクラスで書き直してみることにしました。 また、文字数カウントしてもしょうがないので、apache のログを読み込んで、UserAgent をカウントするようにしました。 1つ書けばコピーして使いまわせるので、備忘録的に書いておきます。 Map/Reduce Tutorial では JobConf クラスを使用しています、この JobConf が de

    mtoyoshi
    mtoyoshi 2011/03/22
    サンプルとの違いが書かれている。
  • 「データのライフ・サイクル」で考えるHadoopの使いどころ

    「データのライフ・サイクル」を考える RDBMSは、「非定型処理への活用」、「バッチ処理のスケール・アウト」という観点で限界に突き当たっています。しかし、RDBMSの豊富な機能が現代のコンピュータ・システムに欠かせない存在であることも間違いありません。この矛盾をどう解決すればいいのでしょうか。 この問題を解決する鍵は、「データのライフ・サイクル」にあります。 RDBMSは、管理するデータはすべて「起きている(活動している)」、つまり「いつでも更新される可能性がある」ことを前提に設計されています。例えば、銀行の口座残高は、バッチ処理が進んでいる最中にも、ATMからの引き出しなどのリアルタイム処理で更新される可能性があります。 しかし、すべてのデータが「起きている」わけではありません。例えば、銀行口座の「昨日の取引履歴」は、過去のデータなので、更新される可能性はまずありません(過去の取引履歴を

    mtoyoshi
    mtoyoshi 2011/03/22
    起きているデータと眠っているデータはキャッチーだ。