タグ

2014年3月25日のブックマーク (2件)

  • 電子書籍『Cloudera Impala』を公開しました - O'Reilly Japan Community Blog

    皆さんこんにちは。以前、オライリー・ジャパンでは無償の電子書籍として『EPUB 3とは何か?』を公開いたしましたが、今回はその第2弾として『Cloudera Impala』を公開しました。書誌情報のページはこちら。前回同様、ダウンロードのためにはEbook Storeのアカウントが必要です。アカウントをお持ちでない方は、サインアップのページからご登録をお願いいたします。 この『Cloudera Impala』、監修をしていただいたCloudera株式会社の皆さん、オライリーのHadoop関連書籍を翻訳していただいている玉川竜司さんのご協力により実現いたしました。昨年行われた「Cloudera World Tokyo 2013」の会場で予告されていたもの。大変お待たせいたしました。 ぜひ書をダウンロードしてお読みいただき、Impalaの魅力を知っていただけたら幸いです。なおImparaと綴

    shiumachi
    shiumachi 2014/03/25
    “Imparaと綴りますと、どこからともなくトマホークが飛んでくるという噂を聞いたことがあります。ご注意ください” なんだこれww
  • Apache Sparkを試す - 偏った言語信者の垂れ流し

    CDH5の環境を手元に作ったので、Apache Sparkを使ってみる。 依存はHDFSのみ。Masterが1台でWorkerが複数台の構成なのかな。 ClouderaManagerで設定して起動するとWebUIがデフォルトでは18080ポートになっていた。 Pythonから使う場合はpysparkコマンドとなる。pysparkコマンドをそのまま実行するとスタンドアロンサーバーが起動してしまう(この場合はWebUIが4040ポートらしい)ので、環境変数でMasterサーバーを指定する。 $ MASTER=spark://master1.hadoop.nullpobug.com:7077 pysparkpysparkコマンドを実行するとPythonシェルが立ち上がる。scという名前の変数でSparkContextのインスタンスを参照できるようになっている。 Welcome to ____ _

    Apache Sparkを試す - 偏った言語信者の垂れ流し
    shiumachi
    shiumachi 2014/03/25
    “絞り込みをPythonのコードで書けるのが面白いですね。ipythonにも対応していて、ipython notebookから操作もできるのでかなり遊べるのでは”