Planet Cassandra is a robust and active community of users and developers who contribute to the success of Apache Cassandra® in a variety of applications, ranging from e-commerce to real-time analytics.
バッチを高速にした後はリアルタイムの世界へ! 現在、さまざまな業種の企業でビッグデータ分析の取り組みが行われている。ビッグデータへの最初の取っ掛かりは、既存のバッチ処理の高速化や、大量の業務データを用いた分析レポートの作成という企業が多いことだろう。そして、バッチ処理の高速化が一段落した次のステップとして、「リアルタイム処理」をテーマに掲げる企業も多いかと思われる。具体的には、 直近10秒間のトラフィックを集計したい。 直近10分間で自社商品がTwitterで話題になった回数を知りたい。 直近10時間での全店舗での来客数を集計したい。 といったリアルタイムなモニタリングを実現したくなるのではないだろうか?こういったモニタリング用の集計は、技術的には「ウインドウ集計(Time-Window Operation)」と呼ばれる。そこで本コラムでは、近頃、「ポストHadoop」として話題のApac
Apache Spark - A Unified engine for large-scale data analytics Apache Spark is a unified analytics engine for large-scale data processing. It provides high-level APIs in Java, Scala, Python and R, and an optimized engine that supports general execution graphs. It also supports a rich set of higher-level tools including Spark SQL for SQL and structured data processing, pandas API on Spark for panda
Apache Sparkは、HDFS、Cassandra、HBase、S3など、様々なデータソースを元に分析を実行することができます。 CassandraのデータをApache Sparkで分析したい 以前、Cassandraについてブログを書きました。Cassandra Java Driverを使って、Cassandraからデータを取得し、Javaで分析することができます。 Cassandra Java Driverで、JavaからCassandraを操作する。 しかし、データ量が多くなると、処理に時間がかかるのが悩みです。 「Apache Mesosで構築したクラスタ上で、Apache Sparkの分散処理を実行する。」で、Apache Sparkによって分析処理が高速化できることが確認できましたので、これをCassandraのデータでも利用したくなります。 Spark Cassand
AWS re:Invent 2015に、参加できなかった方向けに298のBreakout Sessionsをまとめてみました。セッションごとの日本語タイトル(超訳)、公式Webページ、スライド、動画と関連するブログ記事を1ページにまとめています。量が多いので、ページ内検索などでキーワード検索をかけていただくのがオススメです。SlideShare / YouTube / MP3とも徐々に公開されているので、順次追加していきます! 2015/10/16 情報アップデート 公式Webページ(英語) AWS re:Invent 2015 公式現地レポート(日本語) 基調講演 AWS re:Invent 2015 Keynote | Andy Jassy - YouTube AWS re:Invent 2015 Keynote 1 リアルタイムレポート #reinvent AWS re:Invent
Spreadsheet builder provides convenient way how to create MS Excel OfficeOpenXML Documents (XSLX) focus not only on content side but also on easy styling. @Grab(group='org.modelcatalogue', module='spreadsheet-builder-poi', version='0.1.6') // fixes bugs on Groovy 2.4.x @Grab(group='commons-codec', module='commons-codec', version='1.10') @GrabExclude('org.codehaus.groovy:groovy-all') import org.mod
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ / Hadoop / Spark Conference Japan 2019 講演者: 関山 宜孝 (Amazon Web Services Japan) 昨今 Hadoop/Spark エコシステムで広く使われているクラウドストレージ。本講演では Amazon S3 を例に、Hadoop/Spark から見た S3 の動作や HDFS と S3 の使い分けをご説明します。また、AWS サポートに寄せられた多くのお問い合わせから得られた知見をもとに、Hadoop/Spark で S3 を最大限活用するベストプラクティス、パフォーマンスチューニング、よくあるハマりどころ、トラブルシューティング方法などをご紹介します。併せて、Hadoop/Spark に関係する S3 のサービスアップデート、S3 関連の Hadoop
今月からProject Lambaで追加されたAPIについて解説していきます。 Project Lambdaで追加されたAPIというと、Stream APIですが、その前に本連載でもすでに何度も使用しているIterableインタフェースの変更について、あらためて紹介します。 その後、Stream APIについて紹介していきます。 Iterableインタフェースの変更 Java SE 7まで、Iterableインタフェースにはiterateメソッドしか定義されていませんでしたが、デフォルトメソッドを使用して2つのメソッドが追加されました。 1つはこれまでも何度も使用しているforEachメソッド、もう1つがspliteratorメソッドです。 forEachメソッドは拡張for文の内部イテレータ版になります。forEachメソッドの引数の型はjava.util.function.Consum
Search: Cassandra Wiki Login GettingStarted FrontPageRecentChangesFindPageHelpContentsGettingStarted Immutable PageCommentsInfoAttachments More Actions: See "Getting Started" in the documentation here. GettingStarted (last edited 2016-08-10 22:57:22 by JonathanEllis) Immutable PageCommentsInfoAttachments More Actions: MoinMoin PoweredPython PoweredGPL licensedValid HTML 4.01
こんちゃ(´・ω・)ノ 流行のNoSQLデータベースのCassandraについて 記載していこうと思います。 【Apache Cassandraとは】 Apache CassandraはJavaで記述されたオープンソースの分散型NoSQLデータベース。 Facebook社で大規模データに対応するために開発を行っていたが、 2008年7月にOSS(オープンソースソフトウェア)として公開し、 現在はApacheのトップレベルプロジェクトとなっている。 【特徴】 ・ライセンスはApache License 2.0 ・Javaで動作する。 ・スケールアウトによるパフォーマンスの向上が可能。 ・KVS(Key Value Store)のデータモデル。 ・4次元または5次元ハッシュなデータモデルを持つ。 ・キースペース、カラムファミリ、ロウ、スーパーカラム、カラムの順に入れ子構造。 ・カラムが最小単位
前回はCassandraとは何かを簡単に説明しました。第2回では、Cassandraを実際にインストールして開発環境で動かしてみましょう。 Cassandraをインストールしよう 環境を確認する まずは環境の確認をしましょう。筆者の環境は以下のようになっています。 Windows 7 Professional Sun JDK 1.6.0_18 64bit Eclipse 3.5.1 この連載ではおもにWindowsでの環境を想定しています。ただ、CassandraはJavaベースなので、MacやLinuxなど別OSでも同様に動くはずです。 Cassandraをダウンロードする 本連載では現時点での最新版Cassandraha 0.6.1を使います。以下のサイトからダウンロードできます。 The Apache Cassandra Project URL:http://cassandra.ap
PIXTAは2007年にサービスを開始し、年々サービスとシステムの規模が大きくなっおり、それに伴い、組織的な規模も大きくなってきました。 今回はPIXTAにおいて規模が大きくなるシステムと組織をつなぐためのアーキテクチャとしてBackendForFrontend(以下BFF)の導入検討を始めているので、BFFの概要やユースケースを紹介し、ピクスタが抱える問題をどのように解決するかについて、まとめた資料です。 BFFは世の中にで初めてから日が浅く、そこまで認知が行き渡ってないのではないかと思うので、今回話のメインはBFFそのものに焦点を当てて紹介します。 この内容はWeb現場Meetup#4の発表資料です。
リレーショナルデータベースが話題に挙がるとき、私は何かが足りないと思わずにはいられません。データベースはあらゆるところで使われており、その種類も、小規模で便利なSQLiteからパワフルなTeradataまで様々です。しかし、それがどういう仕組みで機能しているかを説明したものとなると、その数はごくわずかではないでしょうか。例えば「リレーショナルデータベース 仕組み」などで検索してみてください。ヒット数の少なさを実感できると思います。さらにそれらの記事は短いものがほとんどです。逆に、近年流行している技術(ビッグデータ、NoSQL、JavaScriptなど)を検索した場合、それらの機能を詳しく説明した記事はたくさん見つかると思います。 リレーショナルデータベースは、もはや大学の授業や研究論文、専門書などでしか扱われないような古くて退屈な技術なのでしょうか? 私は開発者として、理解していないものを
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く