タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

bigdataに関するbobbyjam99のブックマーク (2)

  • 第1回 ビッグデータ分析を始めよう | gihyo.jp

    ビッグデータ分析エンジンを比較してみると、ビッグデータを処理する一般的なインターフェースとしてSQLが提供されていることが主となっています。こうして見ると、最近流行っているビッグデータを使った分析とは、SQLによる分析が主となっていることがわかります。 さらに、他の機能を見てみると、スケジューリングや依存関係を考慮したジョブの実行、データの可視化などは分析エンジン自体は備えておらず、別途用意する利用必要があります。 このように考えてみると、以下の点が気になってきます。 ビッグデータ分析基盤で何をできるようにするのか? ビッグデータ分析基盤と考えたときに他にどういったツールが必要になるのか? SQLによる集計を基にした分析ではどういったことができるのか? 稿では、ビッグデータ分析基盤を構築するために必要な分析エンジンではなく、主にその周辺のエコシステムについてを中心に紹介し、ビッグデータ分

    第1回 ビッグデータ分析を始めよう | gihyo.jp
  • コマンドラインではじめるデータサイエンス

    データ分析における一連の作業(データ収集、データクレンジング、モデリング)をコマンドラインで自由自在に進めるための考え方やツールの使い方を解説します。データの多様化、大規模化に伴い効率的にデータ分析を行う上でコマンドラインツールはかかせません。書では、データ分析作業における各フェーズでのコマンドラインツールの使い方から、効率化のためのワークフローの管理や並列処理などまでを幅広く紹介します。 日語版では監訳者による書のテクニックを利用する時に壁になるであろう「日語処理」と、実務で利用する場合の「ケーススタディ」を収録。エンジニアのみならず、データ分析に携わる全ての方に必携の一冊です。 監訳者まえがき はじめに 1章 イントロダクション 1.1 概要 1.2 データサイエンスはOSEMN 1.2.1 データの獲得 1.2.2 データのクレンジング 1.2.3 データの精査 1.2.4 

    コマンドラインではじめるデータサイエンス
  • 1