タグ

ビッグデータとあとで読むに関するdshimのブックマーク (2)

  • 第2回 Amazon Redshiftとは[後編] | gihyo.jp

    前回はAmazon Redshiftの基的な機能の説明を行いました。今回は一歩踏み込んで、具体的にAmazon Redshiftはどのように利用することができるのか、また他のデータウェアハウスやHadoopなどのビッグデータ処理ミドルウェアと比べて、どのような点が優れているのかを説明します。 Amazon Redshift の得意な点・不得意な点 前回の説明のように、Amazon Redshiftはクラウド上に構築されたデータウェアハウスサービスです。そのため、蓄積された大量データの集計処理に特化されています。 たとえば、過去半年分の全データに対する日付ごと・属性ごとのアクセスユーザの件数を一覧で出力する、などです。これに対して、通常の(行指向)データベースの利用方法である、ある特定のユーザの、特定のデータを取得する、などの処理は、たとえ1件を取得するだけでも数秒かかることがあります。つ

    第2回 Amazon Redshiftとは[後編] | gihyo.jp
  • 「SUUMO」を動かすデータサイエンティストの取り組み

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 昨今、バズワードのように、ビッグデータという言葉をさまざまなところで耳にする機会が多くなりました。「ビッグデータには、われわれの知らないものすごい鉱脈が埋まっているのではないか」「ビッグデータを分析することで、われわれのビジネスを飛躍的に高められるのではないか」。 このようなビッグデータ神話がまことしやかに囁かれている一方で、具体的にビジネスの現場において、ビッグデータを何にどう生かしていけばよいのか分からないという声も聞こえてきています。 リクルートでは、ビッグデータへの取り組みをこの2、3年あまりで加速させ、需要予測や広告予算の最適化、ウェブリコメンデーションなどの分析ソリューションを生み出してきました。ただし、われわれは、意思決定

    「SUUMO」を動かすデータサイエンティストの取り組み
  • 1