タグ

2014年6月18日のブックマーク (4件)

  • Redshiftを使って、もっとも幸福な青空文庫を判定してみる - Qiita

    最近Redshiftを業務で使う機会があったので、概要や使い方などをまとめてみようかと思います。 今回はRedshiftの立ち上げからはじめ、青空文庫さんが公開してくださっている、形態素解析データをRedshiftにいれて解析してみます。 解析といっても、一番多く幸せそうなワードを使っている文庫はどれかを調べるだけ。 一番多く幸せそうなワードを使っていた文庫を、「もっとも幸福な青空文庫」と判定します。 また、今回使用する、6.1GB、8770万行のデータをデフォルト設定でどのくらいでさばけるかなども試してみたいと思います。 今回やること 今回は以下の様なことをします。 ・Redshiftとは何かをまとめ ・青空文庫のデータセットをダウンロードして、S3にアップ ・PostgreSQLが扱えるDBクライアントを用意する ・Redshiftを立ち上げる ・Redshiftにクライアントから接続

    Redshiftを使って、もっとも幸福な青空文庫を判定してみる - Qiita
  • 第1回 脆弱性対策のためにパッケージを入れ替えると言うこと | gihyo.jp

    お声がけをいただいて、連載が始まったわけですが、編集部からのオーダーが「インフラセキュリティ」と言うことで、ちょっとだけ迷いました。 インフラもセキュリティもなんでもそうですが、共通して言えることは「⁠『⁠あたりまえ』の積み重ねが被害を減らす」と言うところだからです。 ただ、ここで言う『あたりまえ』は「セキュリティをやってる人から見た『あたりまえ⁠』⁠」であり、そうでない人から見たら「そうなの?」と言うことも多々あります。 連載では、「⁠これ」と言うことが発生したときに、その内容について解説を試みると言うことは普通にやるとして、そう言う『あたりまえ』的な内容についても紐解いていくような試みをして行こうと思います。 と言うことで、最初は、「⁠脆弱性対策のためにパッケージを入れ替える」と言うところに触れて行きます。 1.ソフトウェアの脆弱性とその修正 バグのないソフトウェアはないと言うくらい

    第1回 脆弱性対策のためにパッケージを入れ替えると言うこと | gihyo.jp
  • EC2に全く新しいSSD-Backed EBSがきたぞ! - りむっちスケッチ

    この瞬間を待ってたぞ! New SSD-Backed Elastic Block Storage http://aws.amazon.com/jp/blogs/aws/new-ssd-backed-elastic-block-storage/ とりあえず公式ブログをざっくりよんでまとめた。 これまでのEBS A Single EBSボリュームで4000IOPSが最大 (1GB - 1TB ディスクサイズにも依存) Multiple PIOPS EBSボリュームで48,000IOPS (with raid) これからのEBS General Purpose (SSD) availabiility 99,999%(3ナイン) これまでの10倍のIOPSに1/10のレイテンシー 期待通りに3,000IOPSが出る (Base performanceという考え方) GBごとに3倍のIOPSを提供す

    EC2に全く新しいSSD-Backed EBSがきたぞ! - りむっちスケッチ
  • やっとわかった、リバースプロキシの設定の意味 - @kyanny's blog

    いままでリバースプロキシの設定がよくわかっていなくて、すでに動いているサーバの設定を見よう見まねで使い回してきた。ちゃんと理解しようと思って、マニュアルを読み直したらやっとわかった。設定の方法 (How) がわかったこと以上に、なぜそう書く必要があるかという理由 (Why) を理解できたのが嬉しい。久しぶりに「わかった!」と叫びたくなった。感動を忘れないうちに、思い出せるように、書いておく。 mod_proxy - Apache HTTP サーバ バージョン 2.2 が Apache のプロキシ関連のマニュアル。 mod_proxy を使うことになる。 大事なディレクティブは、 ProxyPass と ProxyPassReverse のふたつ。 ProxyPass これがリバースプロキシをする上でのほとんどすべてのことをやってくれる。実は見慣れた (コピペし慣れた) 設定ではこのディレク

    やっとわかった、リバースプロキシの設定の意味 - @kyanny's blog