タグ

LDRとTipsに関するkana321のブックマーク (2)

  • 第30回 RubyとHadoopで分散処理 Hadoop Streamingで外部データを読み込む | gihyo.jp

    前回のおさらい 第28回ではHadoop Streamingの仕組みについて説明しました。今回は、実際にHadoop Streamingを利用してデータ解析したときの具体的な話や、利用してみて困った(ハマった)Hadoop Streaming特有の問題とその解決法について紹介していきます。 実際に利用してみて困った(ハマった)こと さて、第28回でも紹介しましたが今回Hadoopを利用したのはopen('http://tabemiru.com/2009'); return false;">たべみるのデータ解析のためです。たべみるのデータ解析では、材名や地域名といった特定の値ごとにデータをまとめる処理が多く、またその処理速度が遅いのが問題だったのですが、このような処理はHadoop上(Ruby)でも比較的簡単に実装することができました。 それで最初は「これはスムーズにHadoop上に処理を

    第30回 RubyとHadoopで分散処理 Hadoop Streamingで外部データを読み込む | gihyo.jp
    kana321
    kana321 2014/12/24
    RubyとHadoopで分散処理 Hadoop Streamingで外部データを読み込む
  • livedoor Readerパーフェクトガイド - livedoor ディレクター Blog

    ※この記事は、2013年3月14日にアップデートしました。 こんにちは、「livedoor Reader」などのディレクターを担当している佐々木です。 「世界の技術者、刺激したい」―ライブドアRSSリーダー英語版公開 「RSSリーダーにも2対8の法則がある」と池邊CTOは言う。2割のヘビーユーザーが、8割のフィードを読んでいるというのだ。「livedoor Readerは、2割の人に最適化している」 これは弊社スタッフの偽らざる音なのですが、そうは言っても、より多くの人に使っていただけるよう、livedoor Readerのサイト上では初心者向けの説明を中心に掲載しています。 しかしそれによって、2割のヘビーユーザーに対して満足な説明ができていなかったのではないか、ということを心配してきました。 そこで今回は、Webディレクター向け(つまり、2割に相当するヘビーユーザーであるべき職種の人

    livedoor Readerパーフェクトガイド - livedoor ディレクター Blog
  • 1