タグ

Cassandraに関するgamiのブックマーク (22)

  • Cassandra Conference in Tokyoに行ってきた « ボーダーレスライフ

    楽天で開催された Cassandra Conference in Tokyo に参加してきました。多くのセッションがありましたが、楽天での採用事例が聞ける最後のセッションに参加しました。実はCassandraに関して、前提知識をほとんど持っていなかったので、自分が正しい理解をしたのか不安ではありますが、、実際に採用し得られたノウハウの紹介や、不具合をオープンソースへフィードバックしているというお話はおもしろかったです。 全体を通して思ったのは、これはCassandraに限った話ではないですが、ノウハウを持たない状態での採用はリスクが高いということです。そして、そのリスクをカバーするために以下の様に失敗の可能性を下げるための準備、失敗した時に迅速に復旧させる為の準備までも意識する必要があると思いました。 設計フェーズではCassandraを意識したクエリやスキーマにする。 テストフェーズでな

  • NoSQLのCassandraが1.0に。読み込み性能は400%向上

    The Apache Software Foundationは、「Apache Cassandra 1.0」のリリースを発表しました。CassandraはNoSQLデータベースの代表的なソフトウェアです。もともとはFacebookで2008年に大規模データ処理のために開発され、その後オープンソースとなって2009年からApache Software Foundationのプロジェクトとして開発されていました。 The Apache Software Foundation Announces Apache Cassandra™ v1.0 : The Apache Software Foundation Blog 分散処理に対応したスケーラブルなデータベースで、単一障害点(Single Point of Failer:SPOF)がなく、ノードを追加していくことで自動的に性能が向上していくという

    NoSQLのCassandraが1.0に。読み込み性能は400%向上
  • ウノウラボ Unoh Labs: 今からはじめるCassandra入門

    こんにちわ、7月に入社したばかりの@emorinsです。 題名の通りですが分散データベース『Apache Cassandra』を紹介したいと思います。 少し前はHadoop(とHBase)と比較されることの多かったCassandraですが、最近はHadoopの人気に押されつつあるようにも感じます。 しかし、CassandraとHadoopは特徴が異なり、よく言われるのがCassandraはリアルタイム処理に向き、一貫性のかわりに可用性を重視し、またHadoopとは違って単一障害点もありません。 今日はそんなHadoopとは違った魅力のある分散データベース『Apache Cassandra』をはじめてみましょう。 目次 Cassandraとは アーキテクチャ Cassandraの特徴 コンシステンシレベル データモデル MemtableとSSTable セットアップ storage-conf

  • Cassandraデータモデル入門 - Arin Sarkissian - Digital Romanticism

    この記事は、Arin Sarkissian氏のブログ記事「http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model」を氏の許可を得て翻訳したものです。(原文公開日:2009年9月1日) ここ1、2ヶ月というもの、DiggのエンジニアリングチームはCassandraについて調べ、遊び、最終的にはプロダクションにデプロイするためにかなりの時間を費やしてきました。これは実に楽しいプロジェクトでしたが、楽しくなる前にCassandraのデータモデルについて理解するために相当の時間を費やしたのです。「'super column'って何だよ」というフレーズが何度も口にされました。 もしあなたのバックグラウンドがRDBMSならば(ほとんどみんながそうでしょうが)、Cassandraのデータモデルについて学ぶ際に、いくつかのネーミング規約で

  • Twitterが、Cassandraの本採用を断念。「いまは切り替えの時期ではない」

    「いまは新しい技術への大規模な移行をする時期ではないと確信している」。Twitterは、サービスの核となるツイートを保存するデータベースを、MySQLによる大規模分散データベースから、NoSQLデータベースであるCassandraへ移行しようとしていました。しかしCassandraへの移行作業を中止し、引き続きMySQLでの運用を継続すると、Twitter Engineering Blogへのエントリ「Cassandra at Twitter Today」で明らかにしました。 これは戦略の変更だ Twitterは利用者からのツイートを、Scalaによって独自開発したミドルウェア「Gizzard」とMySQL、そしてmemcachedを用いた大規模分散データベースに保存しています。 しかしこうした複雑なシステムによる運用は非常に手間がかかり、人的コストを中心としたコストの増加が非常に大きくな

    Twitterが、Cassandraの本採用を断念。「いまは切り替えの時期ではない」
  • 実例で学ぶCassandra - Eric Evans - Digital Romanticism

    この記事はEric Evans氏の記事「http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example/」を、氏の許可を得て翻訳したものです。(原文公開日:2010年5月12日) 最近、Cassandraは注目を集めており、今まで以上に多くの人が組織で使おうと評価しています。こういった人々がCassandraについて詳しく知ろうとするにつれ、私たちのドキュメントが不足していることが明らかになってきました。その中で最たるものは、既存のリレーショナルデータベースのバックグラウンドを持つ人に対するデータモデルの説明です。 問題はCassandraのデータモデルが、伝統的なデータベースのデータモデルと比べて、混乱を引き起こしかねないほど異なっており、それを正そうとして行われた様々な説明が同じく誤解を生み出しているということです。

    実例で学ぶCassandra - Eric Evans - Digital Romanticism
  • GitHub - twitter-archive/snowflake: Snowflake is a network service for generating unique ID numbers at high scale with some simple guarantees.

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - twitter-archive/snowflake: Snowflake is a network service for generating unique ID numbers at high scale with some simple guarantees.
  • Access Cassandra From Scala – Hector

  • インフラエンジニアのためのcassandra入門

    @marqsさんと@muranetさんと一緒にhbstudy#11で発表させていただきました。 これを機にとか言うとでかすぎる気がしますがCassandraが国内でも盛り上がるといいなーと思います。 懇親会でも結構使おうとしている方がいたりしてうちもうかうかしてられないですねw 資料をあげましたのでこちらよろしかったらどうぞ! インフラエンジニアのためのcassandra入門 View more presentations from Akihiro Kuwano. これだけはかかないと! 素晴らしい会を開いて下さっているハートビーツの方々や、スピーカーの方々、来ていただいた方々に感謝しております 非常に楽しかったです! ただいま二日酔いですw

    インフラエンジニアのためのcassandra入門
  • Google Groups

    Content unavailable Click here to try again. If you've seen this page more than once, try switching accounts.

  • Section title

  • Cassandra By Example | Rackspace Cloud Computing & Hosting

    Cassandra has received a lot of attention of late, and more people are now evaluating it for their organization. As these folks work to get up to speed, the shortcomings in our documentation become all the more apparent. Easily, the worst of these is explaining the data model to those with an existing background in relational databases. The problem is that Cassandra’s data model is different enoug

  • cassandra.scala

  • ericflo's twissandra at master - GitHub

    Once activated, we'll place the following badge in your repository's detail box: Twissandra is an example project, created to learn and demonstrate how to use Cassandra. Running the project will present a website that has similar functionality to Twitter.

  • Cassandra修行 — sklave

    日曜大工はPython3kにしようか > Python3kはMySQLドライバ無いのか > じゃあCassandra使ってみるか > thriftもPython3k無いじゃん > じゃあ2.6でCassandraか、という経路によりCassandraにトライしてみることにしました。 修行中の身である故、情報の正確性は無担保。 ためしたCassandraは0.5.1 Cassandraとは Cassandraとは、もともとFacebookが開発して、現在はApacheでホスティングされている分散データベース。最近、TwitterMySQLから移行したことで話題になった。 いわゆるNoSQL(この呼び方は好きじゃないけど)のジャンルに属するデータベースで、データモデルの表現力的には DataStore(GAE) > Cassandra > Key-Value Storeぐらいのものなんじゃな

  • Cassandraのデータモデリング。或いはKeyspaceの設定方法 - プログラマでありたい

    ドキュメントにはサラッとしか書かれていないので、ちょっと解りにくいCassandraのデータ構造及び設定方法です。 公式ドキュメントの致命的な欠点で、データモデルのイメージ図がないので作ってみました。 (Cassandraのデータモデル - DenkiYagiさんの素晴らしいモデル図を写させて貰いました。) KeySpace まずCassandraのデータ構造で一番大きな括りに、keyspaceがあります。RDBに例えると(怒られそうですが)、スキーマやデータベースにあたります。 ColumnFamily ColumnFamilyは、テーブルに当たるものです。重要な点ですが、keypaceとColumnFamilyは、conf/storage-conf.xmlに定義されています。また現時点では、confの内容をシステムに反映させるにはシステムのリスタートが必要になります。 Key & Ro

    Cassandraのデータモデリング。或いはKeyspaceの設定方法 - プログラマでありたい
  • Cassandraのデータモデル - terurouメモ

    ざっくりとしたイメージおよび解説。説明が下手なので画像だけ見た方がいいかも。。。 KeySpace ColumnFamilyの集合。RDBMSでいうところのDatabaseに該当する感じ。 ColumnFamily Key-RowのHashMap(HashMap)みたいな感じ。 Key 1つのRowを示すキー文字列。CassandraではKeyによってデータの分散先(保存先ノード)が確定する。 Row Keyに対するColumnもしくはSuperColumnの集合。ColumnとSuperColumnのどちらが入るかはstorage-conf.xmlの設定による。 また、Cassandraの内部では、Row内のColumnはColumnNameによってソートし保存されている。ソート方法についてもstorage-conf.xmlの設定によって確定する。 Column Cassandraで最小

    Cassandraのデータモデル - terurouメモ
  • Cassandraの使いどころ(Looking to the future with Cassandraの翻訳)

    Cassandra、おもしろいデータベースなのですが、いまいち使いどころが 理解できていません。 Looking to the future with Cassandra 何だかおもしろそうな内容の記事を見つけたので翻訳してみました。 (内容は保証できませんが・・・) これは、Diggというblog等の記事が面白かったら投票できるサービスを 提供しているエンジニアの方が掲載した記事です。 Diggは、現在使用しているデータベースの基盤を拡張する方法を、今も探しています。 Diggでは、よく知られているMySQLを使用したmaster-slave構成を採用しており、 MySQLを使用したID用のデータベースで共有化が可能であるか調査してみました。 しかし、残念ながらこの方法はうまくいきませんでした。 旧来のmaster-slave構成の場合は、マスターとなるデータベースへの書き込みの冗長性確

    Cassandraの使いどころ(Looking to the future with Cassandraの翻訳)
  • Cassandraにhectorを使用してJavaで接続し、検索を実行する

    これまでCassandraとの接続はPythonで行ってきましたが、 通信部分にはThriftを使用しているので、言語は問わないはず。 また、Python + LazyBoyの組み合わせだと、結構な確立で 接続エラーになってしまい、待ちのロジックを入れないといけなかったので、 JavaからCassandraに接続して、検索を実行してみようと思います。 以前、JavaでThriftを使う方法を調べたことがあります。 また、Python + ThriftでCassandraに接続する方法も調べてますので・・・ Debian + Thrift + PythonのサーバーにWindows + Javaから接続する 列指向データベースCassandraにPythonで接続する 列指向データベースCassandraにPython + Thriftで住所データを登録する この辺の知識を統合すれば接続でき

    Cassandraにhectorを使用してJavaで接続し、検索を実行する
  • 第1回 NoSQL、そしてCassandraとは | gihyo.jp

    NoSQLミドルウェアの特徴をもう少し細かく挙げてみます。分量の都合もあり個別には触れませんが、それぞれのNoSQLミドルウェアで差別化部分に関してはかなり詳細に説明がされていますので、ぜひそちらを参照してみてください。 高速に動作する リレーションモデルではないデータモデル スケールアウト型アーキテクチャ コモディティサーバによって構築される スキーマフリー SPOF(単一故障点)を持たない 自動的に複数台へレプリケーションする イベンチュアルコンシステンシまたは一貫性の選択が可能 SQLのような強力なクエリ言語を持たず、シンプルな問い合わせしかできない Cassandraとは何か NoSQLミドルウェアの筆頭といえばGoogle BigTableやAmazon Dynamoですが、オープンソースの世界でもいろいろなものが出てきています。その中でも最近特に注目を集めているのが、Apach

    第1回 NoSQL、そしてCassandraとは | gihyo.jp