タグ

hadoopに関するyappoのブックマーク (4)

  • hadoop-ec2でアクセス解析してみたよ!

    前回(http://d.hatena.ne.jp/lopnor/20080831/1220183688)サンプルプログラムを動かすところまで行きましたけど、今回は例のid:naoyaのhadoop streamingでアクセス解析(http://d.hatena.ne.jp/naoya/20080513/1210684438)するのをやってみます。というかなんとかたどり着いたのでまとめを書きます。 *ec2の使い方 id:rx7さんがとても丁寧に説明されている資料(http://d.hatena.ne.jp/rx7/20080528/p1)があるので、そちらを読めば完璧だと思います。僕もこれでec2が使えるようになりました。 *hadoop-ec2の使い方 https://codezine.jp/article/detail/2841がイントロダクション。http://d.hatena.n

    yappo
    yappo 2008/09/11
    hadooooooooooooooooooooop
  • moratorium | 献本: Googleを支える技術

    : Googleを支える技術 (株)技術評論社 土井様より、西田圭介さん著の「Googleを支える技術」を献して頂きました。有難うございます。届いた1日目に全部読ませていただいたんですが、書くのが遅れました。 このGooglerが出している論文の中でも、特にインフラに関わる論文を平易な日語で解説したものです。CSを学んでいる人にとってはGoogleの持つシステムの全体像を把握するのに最適なですし、初学者にとっても大量のマシンを使ってデータを処理するためにはどのような工夫がいるのかを学べる凄く良いだと思います。プログラマとして世界中のデータを処理しているGoogle技術を理解していることは必須ではないかと思います。 こので興味を持った方は元論文、さらにはreferしている論文を読んで大規模分散システムについて色々と調べると面白いんじゃないんでしょうか。僕は一応全部読んだん

  • Hadoop

    The document discusses setting up Hadoop on a multi-node cluster. It goes through steps such as installing Java, downloading and extracting Hadoop, configuring nodes, formatting the HDFS, and starting processes on all nodes. Commands are shown to check the Hadoop version, run examples, and view logs.

    Hadoop
    yappo
    yappo 2007/12/25
  • Apache Hadoop

    Apache Hadoop The Apache® Hadoop® project develops open-source software for reliable, scalable, distributed computing. The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models. It is designed to scale up from single servers to thousands of machines, each offering local computation an

  • 1