タグ

Cassandraに関するatm_09_tdのブックマーク (30)

  • 実用段階に入ったNoSQLをおさらい 「Cassandra」の概要と導入手順・基本設定

    ビックデータとは はじめに、Cassandraが得意としているビックデータについて解説します。ビックデータという言葉が一般的に使われていますが、実際のところ何を指すのか、これまでとの違いは何かを説明します。 何に使われているのか 「ビックデータ」とは、通常の処理では処理不可能な膨大な蓄積データを指す言葉です。これまでは、処理することをあきらめていた膨大なデータを処理対象とすることで、新しい答えを見出すことを目指しています。しかも短時間で処理することで、タイムリーな活用を目指すのです。 これまでは、ばらばらに発生していたデータが、通信環境の発達でリアルタイムに収集することが可能になりました。個々のデータは小さくても、大量に集まれば膨大なデータです。せっかく集めた膨大データを活用するために時間が掛っては何もなりません。大量に集めたデータを短時間に効率よく処理して、処理結果を得られる必要がありま

    実用段階に入ったNoSQLをおさらい 「Cassandra」の概要と導入手順・基本設定
  • NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(後編)

    NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(後編) 代表的なNoSQLデータベースの1つ「Apache Cassandra」をテーマにしたイベント「Cassandra Summit 2012」が、8月8日にサンタクララで開催されました。 (記事は「NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(後編)」の続きです) 最新版Cassandra 1.1で追加された機能とは Cassandraはどう進化してきたか。昨年1月の0.7が最初のモダンなバージョンだったというのが私の考えだ。0.8では分散カウンターを実装し、セルフチューニング要素を強めた。1.0は、1.0を宣言したこと、そして圧縮機能を備えるなどの前進があった。 そして現在のバージョンが4月にリリースしたCassandra 1.

    NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(後編)
  • NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(前編)

    NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(前編) 代表的なNoSQLデータベースの1つ「Apache Cassandra」をテーマにしたイベント「Cassandra Summit 2012」が、8月8日にサンタクララで開催されました。 Cassandraは、キーバリュー型データストアとして高速なデータの入出力や高いスケーラビリティが特徴です。最新バージョンではマルチデータセンター、マルチテナンシーなど高度な機能も搭載しました。 そうした最新機能などが紹介された、Cassandra Summit 2012で行われたCassandraの主要な開発者Jonathan Ellis氏の基調講演「The State of Cassandra, 2012」の内容をダイジェストで紹介します。 The State of Cassandra, 2012

    NoSQLデータベースの「Cassandra」最新動向。Cassandra Summit 2012(前編)
  • http://blog.eviac.com/2012/08/install-apache-cassandra-on-ubuntu.html

  • Charming Python: Functional programming in Python, Part 3

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    Charming Python: Functional programming in Python, Part 3
  • リニアには性能が上がらない

    Cassandraのスループットの変化を調べた結果を図2に示した。Cassandraのノード(サーバー)数が2、4、6台のそれぞれにおいて、実行する検証用アプリケーションのスレッド数を徐々に増やした。各スレッドで、書き込み、または読み出しを繰り返し実行し、スレッド数を増やしていくことで、Cassandraの負荷を高めていった。 Cassandraに対する負荷を高めていくと、スループットは曲線を描いて向上していくことが分かった。負荷の増加に対して、十分に性能が向上しなくなったポイントを探し、2、4、6ノードの場合を比較した。検証用の機器は、プリファードインフラストラクチャーから貸与を受けた まず分かったのは、アクセス負荷を高めたとき、Cassandraのスループットは曲線を描いて、向上していくことだ。RDBなど多くのデータベースは負荷を高めていくと、スループットはほぼリニアに伸び、あるしきい

    リニアには性能が上がらない
  • 58blog: DevSumi「Cassandraで見るNoSQL」を聴いた際の備忘録

    2011/04/30 DevSumi「Cassandraで見るNoSQL」を聴いた際の備忘録 引き続き、Developer's Summitに參加した際の備忘録です。 Developers summit cassandraで見るNoSQL View more presentations from Ryu Kobayashi NoSQLの概要からCassandraの特徴紹介です。 印象深かったのは、NoSQLなら良いというのではなく、多数あるNoSQLミドルウェアにも特徴があり、RDBも含めて適材適所で使うべきが真の技術であるというご意見。 そして、システム、サービスを使うお客様にとっては、裏側の技術は重要ではないとのご意見。 後者については、その言葉の裏側の真意を、我々技術者は常に頭に置いておかなくてはならないと思いました。 以下、当時のメモです。乱文、誤記、ご容赦願います。

  • m7a.me - m7a リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • Cassandraが0.8にバージョンアップ。SQLに似たCQLを搭載し、分散カウンターも実装

    RackspaceのEric Evans氏がCassandraのメーリングリストに投稿した内容によると、Cassandra 0.8の最大の特徴は、SQLに似た問い合わせ言語のCQL(Cassandra Query Language)をはじめて搭載したこと。 また、これまで要望の多かった分散カウンターを実装し、ノード間の暗号化通信を実装したことでパブリッククラウドなどの環境でのセキュリティが高まったとしています。 CQL 1.0では、USE、SELECT、UPDATE、DELETE、TRUNCATE、DROP、BATCHなどのキーワードを備えており、SQL文のようにデータベースの内容を操作できるとのこと。PythonJava、Node.js用のドライバーが提供されています。 CQLについては、第16回Cassandra勉強会での@yukim氏の資料「CQL」が公開されています。分かりやすく

    Cassandraが0.8にバージョンアップ。SQLに似たCQLを搭載し、分散カウンターも実装
  • Cassandra実践入門―Twitter、Facebookが採用するNoSQLシステム | gihyo.jp

    はじめに 2010年のはじめ、TwitterがApache CassandraというJavaで実装された分散型のデータストアシステムを採用しつつあるというニュースが話題を呼びました。このことでCassandraは、NoSQLと呼ばれるシステムの中で最も注目を集めるものの一つになったと言えるでしょう。 2010年7月の時点で、Twitterは、位置情報のデータストレージ、トップツイート(トップページに表示される人気ツイート一覧)などのリアルタイム分析、データマイニング処理など、多くの用途でCassandraを活用しています。また、Cassandraを生み出し、のちにApache Foundationに寄贈したFacebookでは、5億人規模・150Tバイト以上のデータ量を持つユーザメッセージの検索機能(Inbox Search)を、150ノードのCassandraクラスタで処理しています。

    Cassandra実践入門―Twitter、Facebookが採用するNoSQLシステム | gihyo.jp
  • 第1回HBaseとCassandraの討論会のメモ - ひしだまの変更履歴

    HBaseとCassandra討論会のつっこみー。 (豊月) 2010-11-08 10:51:55 >HBaseはキーが偏ると一部のノードだけに負荷がかかる これは「Cassandraは、キーが偏ると一部のノードだけに負荷が掛かる」です。 HBaseの場合は、リージョンファイル毎に分散させているので、リージョンファイルの指定サイズを越えてまで大きくなったら自動で分割されて、別のノードへ移ります。 Cassandraの場合、キーのハッシュを元に担当を決めるので巧くキーの生成ルールを考えないと特定ノードに負荷が集中する事になります。 >「このトークンはこのリング」 「Ring上で、このTokenはこのノード」という情報を管理している、が正しいです。 >Cassandraは構築は楽だが、故障時が面倒(リバランスに時間がかかる) Cassandraに於いて面倒なのは、故障時じゃないです。 故障後

    第1回HBaseとCassandraの討論会のメモ - ひしだまの変更履歴
  • Legacy Communities - IBM Community

    If you’re looking for a developerWorks forum — Don't panic! You are in the right place. You are here because specific IBM developerWorks forums, blogs and other Connections content have been decommissioned. This page will help you find the content you are looking for, get answers to your questions, and find a new community to call home. Where am I? You are on the IBM Community area, a collection o

  • Cassandra入門と、さらに詳しく知るためのリソース集

    クラウド時代の新しいデータベースとして、非リレーショナルな構造を持つNoSQLデータベースが話題になっています(NoSQL=Not Only SQL。命名の経緯はこちら)。そのNoSQLの中で、もっとも注目されているデータベースの1つがApacheのCassandraです。 Cassandraは、Facebookで大規模データ処理のために開発され、その後オープンソースとなり、現在ではApache Software Foundationのプロジェクトとして開発されています。 現在、CassandraはFacebookやDiggなどで使われている、もしくは使うことが検討されているとされ、Twitterでも(ツイートデータの格納には使われないようですが、それ以外の用途で)利用されています。 TwitterとDiggがNoSQLの「Cassandra」を選ぶ理由 Twitterが、Cassandr

    Cassandra入門と、さらに詳しく知るためのリソース集
  • cassandraにscala REPLからアクセスする - marblejediary

    セブンイレブンにいって買い物したらAKB48キャンペーンでコーヒーとお茶がもらえたので、今日が私のcassandra記念日。 ということで、cassandraにscala REPLからアクセスしてみます。 とりあえずインストールから。一応結構前に触ってたのですが、会社のPCで遊んでたときなので、自宅で環境つくるのは初めてだったり。そんな僕にもmacportsがありますので。 sudo port install cassandra わーい一瞬だ。 で、cassandraのサーバーをあげます。 sudo cassandra -f 意味わかってないですが、-fをつけないとなぜかconnection refusedとか言われてはまりました。あとでちゃんと調べます。 ではscalaからつなぎます。 いちおう、scalaははいっている前提で。portのupdateがきてないぽいのでRCですが、scal

    cassandraにscala REPLからアクセスする - marblejediary
  • Cassandraデータモデル入門 - Arin Sarkissian - Digital Romanticism

    この記事は、Arin Sarkissian氏のブログ記事「http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model」を氏の許可を得て翻訳したものです。(原文公開日:2009年9月1日) ここ1、2ヶ月というもの、DiggのエンジニアリングチームはCassandraについて調べ、遊び、最終的にはプロダクションにデプロイするためにかなりの時間を費やしてきました。これは実に楽しいプロジェクトでしたが、楽しくなる前にCassandraのデータモデルについて理解するために相当の時間を費やしたのです。「'super column'って何だよ」というフレーズが何度も口にされました。 もしあなたのバックグラウンドがRDBMSならば(ほとんどみんながそうでしょうが)、Cassandraのデータモデルについて学ぶ際に、いくつかのネーミング規約で

  • Cygwin on Windows7で"快適な"CassandraとかHadoopとかの開発環境【書きかけ】 - terurouメモ

    MinGW on Windows7(x64)でCassandraやらHadoopやらの調査・アプリ開発をしていたのだが、あまりに不便、というか無理なのでCygwinに移行することにした。素直にCentOSの仮想マシン構築しろって話もあるんだけど、EclipseやらWebブラウザやらExcelやら立ち上げてると、すぐにメモリ4GBぐらいいつぶすので。。。 インストール概要 とりあえず最小限しか入れないように。必要になった時点で足す感じで。 CassandraやHadoop(+ZooKeeper)を使える環境。 日語はUTF-8に。 X11、Gnome、KDE関係はインストールしない。 zshをインストールする。使ったことないけど。 lessの代わりlv。 Thriftのビルドに必要なパッケージをインストール。 ThriftInstallationWin32 - Thrift Wiki C

    Cygwin on Windows7で"快適な"CassandraとかHadoopとかの開発環境【書きかけ】 - terurouメモ
  • http://blog.ik.am/entries/32

  • 実例で学ぶCassandra - Eric Evans - Digital Romanticism

    この記事はEric Evans氏の記事「http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example/」を、氏の許可を得て翻訳したものです。(原文公開日:2010年5月12日) 最近、Cassandraは注目を集めており、今まで以上に多くの人が組織で使おうと評価しています。こういった人々がCassandraについて詳しく知ろうとするにつれ、私たちのドキュメントが不足していることが明らかになってきました。その中で最たるものは、既存のリレーショナルデータベースのバックグラウンドを持つ人に対するデータモデルの説明です。 問題はCassandraのデータモデルが、伝統的なデータベースのデータモデルと比べて、混乱を引き起こしかねないほど異なっており、それを正そうとして行われた様々な説明が同じく誤解を生み出しているということです。

    実例で学ぶCassandra - Eric Evans - Digital Romanticism
  • NoSQLを超えるSQLデータベース「VoltDB」。Cassandraとベンチマーク対決!

    「多くのOLTPデータベースは30年前の設計を基にしており、今日の“Webスケールな”データベースの負荷を想定していない。これら伝統的なデータベースは、処理時間の90%以上がログ、ロック、ラッチ、バッファ制御といったオーバーヘッドに費やされ、しかもそれらによって限られた性能やスケーラビリティしか実現できていない」 Ingresの開発者でありInformixのCTOなどデータベースベンダの要職を歴任したデータベース研究者の大御所、マイケル・ストーンブレイカー氏が開発したVoltDBはプレスリリースでこのように既存のリレーショナルデータベースの欠点を示した上で、インメモリデータベースをベースにこれらのオーバーヘッドを除去し、ACIDによるデータ一貫性を維持しつつ大きな性能向上とスケーラビリティを実現したと説明されています。 SourceForge.jpの記事「「NoSQL」を上回る性能を目指す

    NoSQLを超えるSQLデータベース「VoltDB」。Cassandraとベンチマーク対決!
  • 第3回 Cassandraのデータモデルを理解する | gihyo.jp

    前回までの説明でCassandraのインストールと動かすところまでいきました。今回はCassandraのデータモデルを理解して、実際にデータにアクセスしてみましょう。 データはすべて4次元または5次元の連想配列 Cassandraのデータは非常にシンプルなデータモデルを持っています。データはすべて4次元または5次元の連想配列のようになっています。 4次元の場合は以下の形で値にアクセスします。 [キースペース][カラムファミリ][キー][カラム] そして5次元の場合は以下の形でデータを特定します。 [キースペース][カラムファミリ][キー][スーパーカラム][カラム] Cassandraのデータモデルは以下の4つの概念で成り立っています。 カラム: データの最小単位。実際のキーと値、そしてタイムスタンプを持つ。 スーパーカラム: カラムの集合を扱う単位。 カラムファミリ: カラムまたはスーパ

    第3回 Cassandraのデータモデルを理解する | gihyo.jp