2014年7月3日のブックマーク (5件)

  • BigQueryことはじめ。あとBigQueryについて料金とか運用とか調査 - Qiita

    まだ入門もしてないので「ことはじめ」じゃないです。 大体触ってみたのを載せます。 Wikipedia 集計 サンプルデータのwikipediaを集計してみました。 データは3億行ほどあり、サイズは36GBほどあります。 今回は、contributor_usernameを集計し、wikipediaに貢献している人ランキングをつくりました。 上位陣はbotさん達ですね。 結果としては、3億行のデータを、 何も考えずに書いて 16.2秒で集計することが出来ました。 3億行を16秒。 countしなければ3秒くらいで終わります。 MapReduceみたいなのを一切書いてないのにこの速度。 ちなみにテーブルはインデックスしているわけではなく毎回フルスキャンしているらしい。 わお。 データ保管: \$0.026/GB/mo クエリ: $5/TB (スキャンしたデータのサイズで課金) 今回のwikipe

    BigQueryことはじめ。あとBigQueryについて料金とか運用とか調査 - Qiita
  • BigQueryにTwitterのタイムラインを入れる [Ruby]

    Twitter のタイムラインを保存しておくとなにかと便利なので、色々と保存形式を変えながら 4 年くらい記録し続けている。ツイートの保存が便利すぎるので、ツイセーブというサービス化までした。かつてはテキストで、MongoDBMySQL とか Groonga とかいろいろやってきた。どれも問題ないんだけど、増え続けるログデータを保存する場所として考えると BigQuery が現代にマッチしてるようなのでそちらに移行した。 BigQuery に TL を保存するとできること TL の全てのデータをフルスキャンできる。これはかなり便利で、今回このブログ記事を書くにあたっても ‘BigQuery’ を TL から検索すれば、信頼できるフォローイングの人々の声を見ることができた。これにより「某 CA 社では 5000 台の MongoDB クラスタで BigQuery に対抗している」という

    BigQueryにTwitterのタイムラインを入れる [Ruby]
    FumblePerson
    FumblePerson 2014/07/03
    そろそろBigData系もある程度知っておかないとと思いつつ、学習コスト高いのが…と思ってたけど、もうBigQueryで良いんじゃないか疑惑
  • ページが見つかりませんでした - 株式会社サーバーワークス

    お探しのページは一時的にアクセスできない状況にあるか、移動もしくは削除された可能性がございます。 大変申し訳ございませんが、ヘッダーメニューもしくはトップページから目的のページをお探しください。 We're sorry - we can't find the page you're looking for. We could take you back to the Serverworks home page.

    ページが見つかりませんでした - 株式会社サーバーワークス
    FumblePerson
    FumblePerson 2014/07/03
    おー、ついに札幌進出正式リリースですか!
  • AWSで新タイプのインスタンス発表。バースト可能なマイクロインスタンスの後継機 - プログラマでありたい

    どこぞの公式ブログっぽいタイトルになりましたが、AmazonのクラウドであるAWSの仮想サーバのec2に新タイプのインスタンスが追加されました。T2タイプです。その名の通り、t1.microの後継です。t1.microは、全インスタンスタイプの中で唯一CPUのバースト特性を持ったインスタンスです。バースト特性とは、短期的(十秒程度)に来のCPU性能以上のリソースを利用できる機能です。サーバの用途として、普段のCPU使用率は10%以下でたまに跳ね上がるというものは割りと多いので、バースト特性は割りと面白いサービスです。しかし、t1.micorは、メモリが0.613GBです。21世紀になって14年という時を考えると、余りにストイック過ぎました。 T2シリーズとは そこで登場したのが、今回のT2シリーズです。ラインナップは、microだけでなくsmall,mediumもあります。当然、メモリも

    AWSで新タイプのインスタンス発表。バースト可能なマイクロインスタンスの後継機 - プログラマでありたい
    FumblePerson
    FumblePerson 2014/07/03
    “m1.smallはt2.smallに乗り換えた方が良いですよという話です。AMIのHVMからparavirtualへの再構築も、Chefのような仕組みを使っていれば簡単にできるんでしょうね。”
  • T2インスタンス調査結果 - Qiita

    先日、新インスタンスタイプとなるT2インスタンスがリリースされましたね! 【AWS発表】バースト可能な性能を持つ新しい低コストEC2インスタンス いままで特にお世話になっていた t1.micro/m1.small の 後継というべきインスタンスでしょうか。 しかし実際に使ってみると、T2インスタンスならではの特徴がいくつかあるようです。 これから一番お世話になりそうなT2インスタンスですし もう少し詳細に調査し、その結果をまとめてみました。 ベースライン/クレジット/バーストという概念 CPUの性能に関する概念です。 t1.microにもバーストという機能はありましたが T2では実装が大きく異なるようです。 要約すると

    T2インスタンス調査結果 - Qiita