タグ

2015年1月22日のブックマーク (3件)

  • Spark on EMR(YARN対応)を動かす - Qiita

    はじめに ほとんどのデータをS3に突っ込んでいる場合、アドホックな分析であったり統計モデル作成をしたりする際に、適当にバケットまるっとロードしてSparkSQLでクエリなげたりMlibに突っ込むというのは割りとよくあることかと思います。 EMRでSparkを動かす際に、これまではYARNに対応しているBootstrap Actionが無かったので設定がだるかったのですが、awslabsがYARN対応のbootstrap actionsを出しているのでそれを試してみます。 http://blogs.aws.amazon.com/bigdata/post/TxO6EHTHQALSIB/Getting-Started-with-Amazon-EMR-Bootstrap-Actions https://github.com/awslabs/emr-bootstrap-actions/tree/ma

    Spark on EMR(YARN対応)を動かす - Qiita
  • Amazon EC2 の料金 | AWS 公式

    Amazon EC2 は無料でお試しいただけます。EC2 インスタンスの支払いには、オンデマンド、Savings Plans、リザーブドインスタンス、Amazon EC2 スポットインスタンスなど、複数の方法があります。 EC2 費用の最適化の詳細については、「Amazon EC2 のコストと容量の最適化」を参照してください。 EC2 は AWS 無料利用枠に含まれているので、無料で開始できます。これには、1 年間毎月 750 時間分の Linux および Windows の t2.micro インスタンス (t2.micro が利用できないリージョンでは t3.micro) が含まれています。無料利用枠内に抑えるには、EC2 マイクロインスタンスのみを使用してください。 AWS 無料利用枠には、EC2 インスタンスで使用すると、1 か月あたり 750 時間のパブリック IPv4 アドレス

    Amazon EC2 の料金 | AWS 公式
    xiangze
    xiangze 2015/01/22
  • 刀剣乱舞集計速報_20150121 - あんちべ!

    はじめに 刀剣乱舞がリリースされ早くも一週間が経過しました。 pixivでも刀剣乱舞の作品が多数投稿されているように思われます。 ここで一度pixivに投稿された刀剣乱舞のデータを集計した結果を 速報として公開したいと思います。 稿では下記について集計します。 作品別日次投稿数推移比較 作品別一週間の合計投稿数比較 投稿数分布 刀毎各指標一覧 共起ネットワーク データ取得設定 pixivからとある方法でデータを取得しました。 データ取得期間は 2015/01/14 13:00 ~ 2015/01/21 12:59 です*1。 作品によっては広く用いられている略称もあります。 私の知る限りにおいて略称でも広く通用している場合はそれもタグ検索時に用いています。 (例:艦隊これくしょん→艦これ) なお、取得時にフィルタを掛けているため、 全データを漏れなく取得しているわけではないことに注意して

    刀剣乱舞集計速報_20150121 - あんちべ!
    xiangze
    xiangze 2015/01/22