Ebitchのブックマーク - はてなブックマーク

Planet Cassandra

Planet Cassandra is a robust and active community of users and developers who contribute to the success of Apache Cassandra® in a variety of applications, ranging from e-commerce to real-time analytics.

Ebitch 2016/01/28

リンク

Apache Sparkで始めるお手軽リアルタイムウインドウ集計 | NTTデータ先端技術株式会社

バッチを高速にした後はリアルタイムの世界へ！現在、さまざまな業種の企業でビッグデータ分析の取り組みが行われている。ビッグデータへの最初の取っ掛かりは、既存のバッチ処理の高速化や、大量の業務データを用いた分析レポートの作成という企業が多いことだろう。そして、バッチ処理の高速化が一段落した次のステップとして、「リアルタイム処理」をテーマに掲げる企業も多いかと思われる。具体的には、直近10秒間のトラフィックを集計したい。直近10分間で自社商品がTwitterで話題になった回数を知りたい。直近10時間での全店舗での来客数を集計したい。といったリアルタイムなモニタリングを実現したくなるのではないだろうか？こういったモニタリング用の集計は、技術的には「ウインドウ集計（Time-Window Operation）」と呼ばれる。そこで本コラムでは、近頃、「ポストHadoop」として話題のApac

Ebitch 2016/01/28

リンク

Overview - Spark 3.5.1 Documentation

Apache Spark - A Unified engine for large-scale data analytics Apache Spark is a unified analytics engine for large-scale data processing. It provides high-level APIs in Java, Scala, Python and R, and an optimized engine that supports general execution graphs. It also supports a rich set of higher-level tools including Spark SQL for SQL and structured data processing, pandas API on Spark for panda

Ebitch 2016/01/28

リンク

Cassandraの大規模データをApache Sparkの分散処理で分析する！

Apache Sparkは、HDFS、Cassandra、HBase、S3など、様々なデータソースを元に分析を実行することができます。 CassandraのデータをApache Sparkで分析したい以前、Cassandraについてブログを書きました。Cassandra Java Driverを使って、Cassandraからデータを取得し、Javaで分析することができます。 Cassandra Java Driverで、JavaからCassandraを操作する。しかし、データ量が多くなると、処理に時間がかかるのが悩みです。「Apache Mesosで構築したクラスタ上で、Apache Sparkの分散処理を実行する。」で、Apache Sparkによって分析処理が高速化できることが確認できましたので、これをCassandraのデータでも利用したくなります。 Spark Cassand

Ebitch 2016/01/28

リンク

(DAT204) NoSQL? No Worries: Build Scalable Apps on AWS NoSQL Services

Ebitch 2015/10/20

リンク

https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/dynamodb-dg.pdf

Ebitch 2015/10/20

リンク

AWS re:Invent2015【保存版】全セッションを網羅！非公式まとめ #reinvent | DevelopersIO

AWS re:Invent 2015に、参加できなかった方向けに298のBreakout Sessionsをまとめてみました。セッションごとの日本語タイトル(超訳)、公式Webページ、スライド、動画と関連するブログ記事を1ページにまとめています。量が多いので、ページ内検索などでキーワード検索をかけていただくのがオススメです。SlideShare / YouTube / MP3とも徐々に公開されているので、順次追加していきます！ 2015/10/16 情報アップデート公式Webページ(英語) AWS re:Invent 2015 公式現地レポート(日本語) 基調講演 AWS re:Invent 2015 Keynote | Andy Jassy - YouTube AWS re:Invent 2015 Keynote 1 リアルタイムレポート #reinvent AWS re:Invent

Ebitch 2015/10/20

リンク

Groovy Spreadsheet Builder

Spreadsheet builder provides convenient way how to create MS Excel OfficeOpenXML Documents (XSLX) focus not only on content side but also on easy styling. @Grab(group='org.modelcatalogue', module='spreadsheet-builder-poi', version='0.1.6') // fixes bugs on Groovy 2.4.x @Grab(group='commons-codec', module='commons-codec', version='1.10') @GrabExclude('org.codehaus.groovy:groovy-all') import org.mod

Ebitch 2015/10/20

リンク

SQLアンチパターン - 開発者を待ち受ける25の落とし穴 (拡大版)

SQLアンチパターン 26章「とりあえず削除フラグ」 2015/08/31 @ GMO Yours #ronsakucasual https://atnd.org/events/68902

Ebitch 2015/10/20

リンク

初心者向けMongoDBのキホン！

初心者向けにMongo DBの基本を解説しています。この資料は2014/3/1のOSC 2014 Tokyo/Springで発表しました。 2015/3/3最新の情報で一部アップデートしました。 2015/7/15Mongo DB ver3.0ようにちょっと修正しました。Read less

Ebitch 2015/10/20

リンク

Apache Spark の紹介（前半：Sparkのキホン）

第16回 Hadoopソースコードリーディング(2014/05/29) 発表資料『Apache Sparkのご紹介』（前半：Sparkのキホン） NTTデータ基盤システム事業本部 OSSプロフェッショナルサービス土橋昌 (Masaru Dobashi) http://oss.nttdata.co.jp/ 後半はこちら → http://www.slideshare.net/hadoopxnttdata/apache-sparkRead less

Ebitch 2015/10/20

リンク

がっつりMongoDB事例紹介

Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ / Hadoop / Spark Conference Japan 2019 講演者：関山宜孝（Amazon Web Services Japan）昨今 Hadoop/Spark エコシステムで広く使われているクラウドストレージ。本講演では Amazon S3 を例に、Hadoop/Spark から見た S3 の動作や HDFS と S3 の使い分けをご説明します。また、AWS サポートに寄せられた多くのお問い合わせから得られた知見をもとに、Hadoop/Spark で S3 を最大限活用するベストプラクティス、パフォーマンスチューニング、よくあるハマりどころ、トラブルシューティング方法などをご紹介します。併せて、Hadoop/Spark に関係する S3 のサービスアップデート、S3 関連の Hadoop

Ebitch 2015/10/20

リンク

詳解 Java SE 8 第5回 Stream API その1

今月からProject Lambaで追加されたAPIについて解説していきます。 Project Lambdaで追加されたAPIというと、Stream APIですが、その前に本連載でもすでに何度も使用しているIterableインタフェースの変更について、あらためて紹介します。その後、Stream APIについて紹介していきます。 Iterableインタフェースの変更 Java SE 7まで、Iterableインタフェースにはiterateメソッドしか定義されていませんでしたが、デフォルトメソッドを使用して2つのメソッドが追加されました。 1つはこれまでも何度も使用しているforEachメソッド、もう1つがspliteratorメソッドです。 forEachメソッドは拡張for文の内部イテレータ版になります。forEachメソッドの引数の型はjava.util.function.Consum

Ebitch 2015/10/20

リンク

至極のJavaクイズ総集編

Monitoring Casual Talks #7 #monitoringcasual ここ 4 年ぐらいのモニタリング系の OSS/SaaS を列挙してみました。太字は気になってるやつです。 ※このスライドは個人の見解であり、所属する組織の公式見解でも組織を代表するものでもありません※

Ebitch 2015/10/20

リンク

GettingStarted - Cassandra Wiki

Search: Cassandra Wiki Login GettingStarted FrontPageRecentChangesFindPageHelpContentsGettingStarted Immutable PageCommentsInfoAttachments More Actions: See "Getting Started" in the documentation here. GettingStarted (last edited 2016-08-10 22:57:22 by JonathanEllis) Immutable PageCommentsInfoAttachments More Actions: MoinMoin PoweredPython PoweredGPL licensedValid HTML 4.01

Ebitch 2015/10/20

リンク

ビーキョウのIT Cassandra - 概要 -

こんちゃ(´・ω・)ﾉ流行のNoSQLデータベースのCassandraについて記載していこうと思います。【Apache Cassandraとは】 Apache CassandraはJavaで記述されたオープンソースの分散型NoSQLデータベース。 Facebook社で大規模データに対応するために開発を行っていたが、 2008年7月にOSS（オープンソースソフトウェア）として公開し、現在はApacheのトップレベルプロジェクトとなっている。【特徴】・ライセンスはApache License 2.0 ・Javaで動作する。・スケールアウトによるパフォーマンスの向上が可能。・KVS(Key Value Store)のデータモデル。・4次元または5次元ハッシュなデータモデルを持つ。・キースペース、カラムファミリ、ロウ、スーパーカラム、カラムの順に入れ子構造。・カラムが最小単位

Ebitch 2015/10/20

リンク

第2回　Cassandraのインストールから起動まで | gihyo.jp

前回はCassandraとは何かを簡単に説明しました。第2回では、Cassandraを実際にインストールして開発環境で動かしてみましょう。 Cassandraをインストールしよう環境を確認するまずは環境の確認をしましょう。筆者の環境は以下のようになっています。 Windows 7 Professional Sun JDK 1.6.0_18 64bit Eclipse 3.5.1 この連載ではおもにWindowsでの環境を想定しています。ただ、CassandraはJavaベースなので、MacやLinuxなど別OSでも同様に動くはずです。 Cassandraをダウンロードする本連載では現時点での最新版Cassandraha 0.6.1を使います。以下のサイトからダウンロードできます。 The Apache Cassandra Project URL：http://cassandra.ap

Ebitch 2015/10/20

リンク

from old Java to modern Java

第3回 Java勉強会 in 秋葉原(https://javaintokyo.doorkeeper.jp/events/28737)にて発表したものです。#javaintokyo

Ebitch 2015/10/20

リンク

Spring Boot + Netflix Eureka

PIXTAは2007年にサービスを開始し、年々サービスとシステムの規模が大きくなっおり、それに伴い、組織的な規模も大きくなってきました。今回はPIXTAにおいて規模が大きくなるシステムと組織をつなぐためのアーキテクチャとしてBackendForFrontend(以下BFF)の導入検討を始めているので、BFFの概要やユースケースを紹介し、ピクスタが抱える問題をどのように解決するかについて、まとめた資料です。 BFFは世の中にで初めてから日が浅く、そこまで認知が行き渡ってないのではないかと思うので、今回話のメインはBFFそのものに焦点を当てて紹介します。この内容はWeb現場Meetup#4の発表資料です。

Ebitch 2015/10/20

リンク

リレーショナルデータベースの仕組み (1/3) | POSTD

リレーショナルデータベースが話題に挙がるとき、私は何かが足りないと思わずにはいられません。データベースはあらゆるところで使われており、その種類も、小規模で便利なSQLiteからパワフルなTeradataまで様々です。しかし、それがどういう仕組みで機能しているかを説明したものとなると、その数はごくわずかではないでしょうか。例えば「リレーショナルデータベース仕組み」などで検索してみてください。ヒット数の少なさを実感できると思います。さらにそれらの記事は短いものがほとんどです。逆に、近年流行している技術（ビッグデータ、NoSQL、JavaScriptなど）を検索した場合、それらの機能を詳しく説明した記事はたくさん見つかると思います。リレーショナルデータベースは、もはや大学の授業や研究論文、専門書などでしか扱われないような古くて退屈な技術なのでしょうか？私は開発者として、理解していないものを

Ebitch 2015/10/19

リンク

はてなブックマーク

Ebitchのブックマーク (84)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス