タグ

2010年6月24日のブックマーク (4件)

  • ヤフーにおけるパッケージ管理 - Yahoo! JAPAN Tech Blog

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、R&D統括部 開発推進室 セキュリティプラットフォーム技術の戸田 薫です。 個人的に自宅では、 FreeBSD でよく遊んでいて、FreeBSDのパッケージ管理には、portsnap、portupgrade を利用していますが、ヤフーでは独自の方法で行われます。 その背景としてヤフーには、平均15億以上のPVを支えるためやサービスの付加価値のために何万台ものサーバがあり、サービスやシステムごとに大規模なシステムを構成する必要があるため、一般的なパッケージ管理システムよりもより柔軟で効率的なパッケージ管理が必要となっています。 今回は、ヤフーにおけるパッケージの管理についてご紹介します。 ヤフーインストーラ ヤフーでは

    ヤフーにおけるパッケージ管理 - Yahoo! JAPAN Tech Blog
  • Gangliaによる計算機クラスターの状態監視:tech.ckme.co.jp

    Ganglia(ガングリア)は複数の計算機の状態をウェブ上で簡単に確認できるソフトウェアである。Gangliaのインストール方法について述べる。 必要となるのは、rrdtool、ganglia-monitor、gmetad、ganglia-webfrontendである。そのうち、rrdtool、ganglia-monitorはクラスタの全ノードにインストールする必要がある。 注:もし、1台のみしか状態を監視しないのであれば、MRTGの方が簡単かもしれない。 Gangliaのインストール ubuntu 12.04編 rrdtool 各種データを集めるrrdtoolをインストールする。これは各ノードすべてのインストールする。 $ sudo apt-get install rrdtool Reading package lists... Done Building dependency tree

  • Hadoop+Hive検証環境を構築してみる

    Hadoop+Hive検証環境を構築してみる:Hive――RDB使いのためのHadoopガイド(前編)(1/3 ページ) Hadoop HiveはHadoop上でSQLライクなクエリ操作が可能なDWH向けのプロダクトです。SQLに近い操作が可能なため、HBaseよりもデータベースに慣れ親しんだみなさんには使い勝手がいいかもしれません。稿ではこのHiveの使い方とレビューを行っていきます。

    Hadoop+Hive検証環境を構築してみる
    pandazx
    pandazx 2010/06/24
  • blog.katsuma.tv

    前回、JavaScriptMap Reduceのコードが書けるHadoop Streamingについて紹介しました。 標準入出力さえサポートされてあれば、任意のコードでMap Reduuceの処理が書ける、というものでしたが、エンジニアはそもそも面倒くさがり。コードも書くのも面倒です。 と、いうわけで、今回はもうコードすら書かずにSQLライクでMap ReduceできるHiveというプロダクトについて、まとめたいと思います。 Hive Hiveとは、簡単に言うとHadoop上で動作するRDBのようなものです。 HDFSなどの分散ファイルシステム上に存在するデータに対して、HiveQLというSQLライクな言語で操作できます。 で、面白いのがHiveQLの操作は基的にMap Reduceのラッパーになっていること。 要するに、SELECT文実行すると裏でMap&Reduceのタスクが走り出

    pandazx
    pandazx 2010/06/24