追記) ソースやJavadocのJARファイルなども含めて集める方法を後で書いたので、こちらを見た方がよいかもしれません mvnコマンドで、ソースとJavadocのJARを取得するComments http://d.hatena.ne.jp/Kazuhira/20121226/1356529301 ちょっと前に知って、もう少し前に知りたかったと思ったゴールです…。 dependency:go-offline http://maven.apache.org/plugins/maven-dependency-plugin/go-offline-mojo.html 実行結果は省略しますが、以下のコマンドでカレントのプロジェクトが依存するライブラリやプラグインをすべてローカルリポジトリにダウンロードしてきます。 $ mvn dependency:go-offline 特定のスコープ除外とかもできる
2013年09月07日04:51 カテゴリlinux rpm と yum localinstall Linux のソフトウェアをインストールする時によく見かける rpm パッケージ。 インストールを行うには rpm コマンドか yum localinstall コマンドを使います。 実際にインストールを行う例で使い方をみてみましょう。 Webブラウザの Chrome のインストールをしてみます。 あらかじめ Chrome のパッケージのありかは以下の URL であることがわかってあるとします。 https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm rpm コマンドを使ってみると、次のようなエラーを吐き出します。 [root@localhost username]# rpm -Uvh https:
{"serverDuration": 35, "requestCorrelationId": "b45a8231fbaabbfb"}
You have collected a lot of time series data so now what? It's not going to be useful unless you can analyze what you have. Apache Spark has become the heir apparent to Map Reduce but did you know you don't need Hadoop? Apache Cassandra is a great data source for Spark jobs! Let me show you how it works, how to get useful information and the best part, storing analyzed data back into Cassandra. Th
カーディナリティとは テーブルにカラムがあるとして、カラムに格納されているデータの種類がどのくらいあるのか(カラムの値の種類の絶対値)を、カーディナリティという。 具体例 カーディナリティが低い場合 例えば性別なら、男と女の二種類である。 カラムのデータの種類が、テーブルのレコード数に比べて二種類と少ない。このことを カーディナリティが低い という。 カーディナリティが高い場合 一方顧客番号ならたくさんの種類(番号)が存在することになる。 カラムのデータの種類が、テーブルのレコード数に比べて多い場合、 カーディナリティが高い という。 カーディナリティを踏まえたインデックスの張り方 基本的に、 カーディナリティの高い列に作成する 必要がある。 はじめに、カーディナリティは カラムの値の種類の絶対値と書いたが、先程の例で言うと性別のカーディナリティは2になる。他にも例えば1年間の日付なら1〜
This document discusses messaging queues and platforms. It begins with an introduction to messaging queues and their core components. It then provides a table comparing 8 popular open source messaging platforms: Apache Kafka, ActiveMQ, RabbitMQ, NATS, NSQ, Redis, ZeroMQ, and Nanomsg. The document discusses using Apache Kafka for streaming and integration with Google Pub/Sub, Dataflow, and BigQuery
(追記)若干認識違いな部分があったので修正しました。 前回投稿で書いたように O’REILLYの「Hiveプログラミング」は、日本語による包括的なHiveノウハウリソースとして最適と言えそう。Hive & HBase連携部分なども少ないながら17章 ストレージハンドラとNoSQL にてページが割かれているので、気になった点を引用させてもらう。 HiveのクエリをNoSQLデータベースに対して実行する場合、NoSQLシステムのオーバーヘッドがあるために、そのパフォーマンスはHDFS上の通常のHiveやMapReduceのジョブより低いものになります。その理由の中には、通常のHDFSへのアクセスが完全なシーケンシャルI/Oであるのに対して、サーバーへのソケット接続や、下位層の複数のファイルのマージといった処理があるということがあります。 (略) システム全体の中で、NoSQLデータベースをHa
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く