Python によるデータ分析コンテスト実践 (Part 3)¶本ドキュメントは FIT 2016 チュートリアル資料です. 各種データに対する Python によるデータ処理について,パッケージの利用例を紹介する. 目次¶ 大規模データ処理 (Redshift) Redshift にデータをロードする Redshift による特徴量作成 Redshift でのクラスタサイズごとの実行時間の比較 大規模データ処理 (BigQuery) BigQuery にデータをロードする BigQuery による特徴量作成 BigQuery における実行時間 画像データ (OpenCV) BRISK 特徴点の作成 時系列データ (今回は扱わない) ARIMA モデルを使った季節性のある時系列データのモデル 自然言語データ (今回は扱わない) NTLK による自然言語データの前処理 自然言語データのスコア