データの入手、整形 Amazon S3へのデータのアップロード Amazon Redshift:テーブルの作成 Amazon Redshift:データの投入 Amazon Redshift:SQLによるバッチ処理(ETL) BIツールからの接続確認 また、利用するBIツールはTableau社が提供している『Tableau Desktop』というデスクトップツールを利用したいと思います。文中『Tableau』という言葉が出て来た際はこの『Tableau Desktop』のことを示しているとご理解ください。 データの入手・整形 では分析を行いたいデータを準備するところから見ていきましょう。Tableau社では各種デモで用いることができるようなサンプルデータを公開していますが、今回はそのサンプルデータを利用したいと思います。 以下のリンクで公開されているものは、架空の店舗別・地域別売り上げデータ
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Oracleは米国時間2月19日、同社のビッグデータ製品ポートフォリオに、視覚化ツールと、「Hadoop」をより幅広く利用できるようにするレプリケーションアプリケーションを追加することを発表した。 同社のビッグデータおよび高度分析担当バイスプレジデントのNeil Mendelson氏は、Oracleの計画はHadoopのような破壊的テクノロジをより幅広いエンタープライズ製品に統合していくことだと述べている。Mendelson氏によれば、Oracleのビッグデータ戦略は複数の情報源を対象とする分析ツール群を中心としている。 Oracleはこれによって、いわゆるデータレイク(複数の情報源からの情報をプールする場所)のフロントエンドを提供する
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます オープンソースの「Apache Hadoop」ディストリビューションのベンダーであるMapR Technologiesは米国時間2月18日、「MapR Distribution」の最新バージョンを公開した。ビッグデータのリアルタイム処理能力を向上させたという。 Hadoopの導入によって、企業はある程度のリアルタイムアナリティクスを実現しているものの、この最新バージョンでは、大企業がしばしば直面する、地理的にまたがった環境から生み出される問題の低減を目指している。 バージョン4.1では、地理的にまたがるアクティブな複数のレプリカクラスタを駆動したり、障害復旧性能の向上を目的とした「MapR-DB」のテーブルレプリケータが搭載されている。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く