ブックマーク / linux.wwing.net (4)

  • HDFSのイレイジャーコーディング (Erasure Coding)

    2017/5/19追記: ClouderaのHDFS Erasure Codingのブログ翻訳しました -> Apache HadoopのHDFS Erasure Codingの紹介 以前紹介したHDFSのイレイジャーコーディング「HDFSが変わる?HDFSのイレイジャーコーディング対応」について詳しく書かれたブログがClouderaから公開されました。Hadoop 3.0をターゲットにして開発されているようです。 http://blog.cloudera.com/blog/2015/09/introduction-to-hdfs-erasure-coding-in-apache-hadoop/ 背景から設計の方針、評価まで幅広くかなり詳しく網羅されており読み応えがあります。しかし、日語訳が出るかわからないので、自分用にまとめてみました。間違いを発見したらご指摘下さい。 ※Erasure

    HDFSのイレイジャーコーディング (Erasure Coding)
  • Ibisを使ってみた(2)

    前回セットアップしたIbisを使ってみましょう。 前回の最後の手順で起動したノートブックにはIbisのチュートリアルが用意されています。 まずはbasic tutorialから試してみましょう。 チュートリアル1: Intro and Setup In[数字]: にカーソルを合わせ、三角のアイコンをクリックして実行すると、結果が Out[数字]: に戻ってきます。 Intro and Setupでは、VirtualBox で起動した仮想マシン(のImpala)に接続しています。ここではImplyaと同じパラメータが利用でき、HDFSにはWebHDFS経由で接続できています。 チュートリアル2: Basics Aggregate Filter Limit チュートリアル2では、事前に用意されている functional_alltypes というテーブルに接続して処理を行います。 [code]

    Ibisを使ってみた(2)
    kawamon
    kawamon 2015/07/21
    Impala上でPandasのようにPythonで分析を行えるというIbis(アイビス)を試してみました(2)#cloudera #impala #ibis
  • Ibisを使ってみた(1)

    Ibisリリース 日、Ibis (アイビス=トキ)という、100%オープンソースのPythonプロジェクトが公開されました。 どうやら Cloudera が、Python 製のビッグデータ分析フレームワークというのを出したらしいぞ!Pandas の人が作ったらしいぞ!名前は「Ibis(アイビス)」、つまり「トキ」らしいぞ! https://t.co/3VRrNYnMTj — Sho Shimauchi (@shiumachi) July 20, 2015 IbisはPython用の新しい分析フレームワークです。また、実行エンジンにはImpalaなど利用することができます。PandasなどのPython用の分析フレームワークは便利に使うことができますが、大規模にスケールしないという問題がありました。Ibisを使うことで、ユーザーはHadoopのような大規模スケールの環境で利用できるように

    Ibisを使ってみた(1)
    kawamon
    kawamon 2015/07/21
    Impala上でPandasのようにPythonで分析を行えるというIbis(アイビス)を試してみました(1)
  • YARN/MapReduce v2のチューニング

    Tuning the Cluster for MapReduce v2 (YARN) 良いYARN/MapReduce v2のチューニングドキュメントがあったので共有。 http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cdh_ig_yarn_tuning.html 抜粋すると、24core/256GBのワーカーノードを例にして、HDFSやMapReduce/YARN、HBase、ImpalaやSolr、各種エコシステムのデーモンを実行する場合の それぞれのデーモンへのリソースの配分 ノードマネージャーのプロパティと計算式(!) リソースマネージャーのプロパティとサイジングと計算式(!) ゲートウェイとクライアントの設定 コンテナのプロパティとサイジングと計算式(!) 比較的シンプルなM

    YARN/MapReduce v2のチューニング
    kawamon
    kawamon 2015/03/10
    Tuning the Cluster for MapReduce v2 (YARN)
  • 1