タグ

2016年9月23日のブックマーク (4件)

  • Redshiftを使って、もっとも幸福な青空文庫を判定してみる - Qiita

    最近Redshiftを業務で使う機会があったので、概要や使い方などをまとめてみようかと思います。 今回はRedshiftの立ち上げからはじめ、青空文庫さんが公開してくださっている、形態素解析データをRedshiftにいれて解析してみます。 解析といっても、一番多く幸せそうなワードを使っている文庫はどれかを調べるだけ。 一番多く幸せそうなワードを使っていた文庫を、「もっとも幸福な青空文庫」と判定します。 また、今回使用する、6.1GB、8770万行のデータをデフォルト設定でどのくらいでさばけるかなども試してみたいと思います。 今回やること 今回は以下の様なことをします。 ・Redshiftとは何かをまとめ ・青空文庫のデータセットをダウンロードして、S3にアップ ・PostgreSQLが扱えるDBクライアントを用意する ・Redshiftを立ち上げる ・Redshiftにクライアントから接続

    Redshiftを使って、もっとも幸福な青空文庫を判定してみる - Qiita
    rsakamot
    rsakamot 2016/09/23
    クリストフ伯爵とレミゼが、distinctされていない
  • AWS Black Belt Tech Webinar シリーズ 2015 - Amazon Aurora

    2015年7月31日に開催したAWS Black Belt Tech Webinar シリーズ 2015 - Amazon Auroraの資料です。 Black Beltの予定は以下のURLで公開されています。 http://aws.amazon.com/jp/about-aws/events/#webinar

    AWS Black Belt Tech Webinar シリーズ 2015 - Amazon Aurora
  • MySQL 8.0.0 Development Milestone Release登場!!

    先月、詳解MySQL 5.7を発刊したばかりであるが、MySQL 5.7自体は去年の10月にリリースされたバージョンである。それから約1年弱、MySQLは開発の手を緩めること無く日々改良を重ねている。 そう、MySQL 8.0の登場である。 現在はDevelopment Milestone Release(通称DMR)という状態なので、まだ正式版における機能が固まっている段階ではないという点には注意して欲しい。MySQLの開発プロセスでは、DMRをリリースするごとにその段階で成熟した機能をマージする。DMRを何度かリリースした後に、キリの良いところでリリース候補版となって正式版で追加される機能が一応確定し、その後バグ修正を経て正式版(GA版)がリリースされる予定となっている。詳しくはMySQLのマニュアルを参照して欲しい。 バージョン8.0!!5.7の次は誰もが5.8だと思っていただろう・

    MySQL 8.0.0 Development Milestone Release登場!!
  • Redshiftのルーツを紐解く | DevelopersIO

    IT系勉強会ウォッチャーの川崎です。とある勉強会 で、Redshiftのバージョン表記が「8」台である、という話題が出まして、そこからRedshiftのルーツとなる製品の話をさせていただきました。 select version(); PostgreSQL 8.0.2 on i686-pc-linux-gnu, compiled by GCC gcc (GCC) 3.4.2 20041017 (Red Hat 3.4.2-6.fc3), Redshift 1.0.1056 この記事では、ネット上のリソースから、Redshiftのベースとなる製品についてご紹介したいと思います。 オンプレ版Redshift? みなさんは「オンプレ版のRedshift」とでもいうべき製品があるのをご存知ですか? *1 私がそれについて知ることになったのは、CROSS2016のビデオを見ていた時でした。 「Goog

    Redshiftのルーツを紐解く | DevelopersIO