wlbhiroのブックマーク / 2016年9月5日

wlbhiro id:wlbhiro

2016年9月5日のブックマーク (13件)

Maven オフラインビルド - @//メモ
wlbhiro 2016/09/05
Maven

Maven3
リンク
Mavenをオフラインで使うために、ローカルリポジトリにライブラリをダウンロードしておく - CLOVER🍀
追記）ソースやJavadocのJARファイルなども含めて集める方法を後で書いたので、こちらを見た方がよいかもしれません mvnコマンドで、ソースとJavadocのJARを取得するComments http://d.hatena.ne.jp/Kazuhira/20121226/1356529301 ちょっと前に知って、もう少し前に知りたかったと思ったゴールです…。 dependency:go-offline http://maven.apache.org/plugins/maven-dependency-plugin/go-offline-mojo.html 実行結果は省略しますが、以下のコマンドでカレントのプロジェクトが依存するライブラリやプラグインをすべてローカルリポジトリにダウンロードしてきます。 $ mvn dependency:go-offline 特定のスコープ除外とかもできる
wlbhiro 2016/09/05
Maven

Offline
リンク
-ε-いつかのブログ-з- : rpm と yum localinstall
2013年09月07日04:51 カテゴリlinux rpm と yum localinstall Linux のソフトウェアをインストールする時によく見かける rpm パッケージ。インストールを行うには rpm コマンドか yum localinstall コマンドを使います。実際にインストールを行う例で使い方をみてみましょう。 Webブラウザの Chrome のインストールをしてみます。あらかじめ Chrome のパッケージのありかは以下の URL であることがわかってあるとします。 https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm rpm コマンドを使ってみると、次のようなエラーを吐き出します。 [root@localhost username]# rpm -Uvh https:
wlbhiro 2016/09/05
CentOS
リンク
Hive (SQL-style) Query Language | Treasure Data
{"serverDuration": 35, "requestCorrelationId": "b45a8231fbaabbfb"}
wlbhiro 2016/09/05
Hive

TUNING
リンク
How do I cast using a DataFrame?
Join discussions on data engineering best practices, architectures, and optimization strategies within the Databricks Community. Exchange insights and solutions with fellow data engineers.
wlbhiro 2016/09/05
selectExprは使えそう？

Spark

DataFrame

selectExpr
リンク
how to select all columns that starts with a common label
wlbhiro 2016/09/05
ALLフィールド情報取得

Spark
リンク
Analyzing Time Series Data with Apache Spark and Cassandra
You have collected a lot of time series data so now what? It's not going to be useful unless you can analyze what you have. Apache Spark has become the heir apparent to Map Reduce but did you know you don't need Hadoop? Apache Cassandra is a great data source for Spark jobs! Let me show you how it works, how to get useful information and the best part, storing analyzed data back into Cassandra. Th
wlbhiro 2016/09/05
Spark

Cassandra
リンク
カーディナリティについてまとめてみた - Qiita
カーディナリティとはテーブルにカラムがあるとして、カラムに格納されているデータの種類がどのくらいあるのか(カラムの値の種類の絶対値)を、カーディナリティという。具体例カーディナリティが低い場合例えば性別なら、男と女の二種類である。カラムのデータの種類が、テーブルのレコード数に比べて二種類と少ない。このことをカーディナリティが低いという。カーディナリティが高い場合一方顧客番号ならたくさんの種類(番号)が存在することになる。カラムのデータの種類が、テーブルのレコード数に比べて多い場合、カーディナリティが高いという。カーディナリティを踏まえたインデックスの張り方基本的に、カーディナリティの高い列に作成する必要がある。はじめに、カーディナリティはカラムの値の種類の絶対値と書いたが、先程の例で言うと性別のカーディナリティは2になる。他にも例えば１年間の日付なら1〜
wlbhiro 2016/09/05
RDB

カーディナリティ
リンク
Apache Hive 紹介
This document discusses messaging queues and platforms. It begins with an introduction to messaging queues and their core components. It then provides a table comparing 8 popular open source messaging platforms: Apache Kafka, ActiveMQ, RabbitMQ, NATS, NSQ, Redis, ZeroMQ, and Nanomsg. The document discusses using Apache Kafka for streaming and integration with Google Pub/Sub, Dataflow, and BigQuery
wlbhiro 2016/09/05
Hive
リンク
Spark 1.5.2: Grouping DataFrame Rows over a Time Range
wlbhiro 2016/09/05
Spark

time

TIMESPAN
リンク
改めてHive & HBase連携 – OpenGroove
（追記）若干認識違いな部分があったので修正しました。前回投稿で書いたように O’REILLYの「Hiveプログラミング」は、日本語による包括的なHiveノウハウリソースとして最適と言えそう。Hive & HBase連携部分なども少ないながら17章ストレージハンドラとNoSQL にてページが割かれているので、気になった点を引用させてもらう。 HiveのクエリをNoSQLデータベースに対して実行する場合、NoSQLシステムのオーバーヘッドがあるために、そのパフォーマンスはHDFS上の通常のHiveやMapReduceのジョブより低いものになります。その理由の中には、通常のHDFSへのアクセスが完全なシーケンシャルI/Oであるのに対して、サーバーへのソケット接続や、下位層の複数のファイルのマージといった処理があるということがあります。（略）システム全体の中で、NoSQLデータベースをHa
wlbhiro 2016/09/05
Hive

HBase
リンク
transaction 検索コマンド | Splunk Blog
wlbhiro 2016/09/05
Splunk

transaction
リンク
SparkAction for yarn-cluster
wlbhiro 2016/09/05
“The default sharelib distributed with Oozie in HDP2.3 for the spark action is not assembled for YARN.”

HDP

HDP2.3

YARN

Oozie

Spark
リンク
- 2016年9月6日
- 2016年9月5日
- 2016年9月4日