Deep Dive on ClickHouse Sharding and Replication-2202-09-22.pdf

Deep Dive on ClickHouse Sharding and Replication-2202-09-22.pdf
ウォンテッドリーでは、「シゴトでココロオドル人の数」の最大化を目指して開発を行なっています。 その上で、このWantedly Visitでは、「MAU」「応募」「売上」を大きな三つの指標としてサービスを運営しています。 サービスによって、分析指標は異なりますが、今回いくつかのデータ分析の基本パターンについて説明したいと思います。 AARRRとはベンチャーキャピタリストである、デイブ・マクルーアが成功するビジネスの構築に必要な「5つの要素」の頭文字からその名前をつけたものです。 具体的には、獲得・アクティベーション・定着・収益・紹介です。 Wantedlyでは初期からこれらの指標をKPIとして定め、開発を行ってきました。これらのAARRRを監視するために必要な分析のパターンを今回ご紹介します。また、特に定着はその中でも最重要でサービスの成長の鍵になります。 7つの分析パターン1. DAU /
DBのデータ量が増えてきた場合の対策の1つとしてユーザIDなどをキーにデータベースを分割するシャーディングと呼ばれる手法があります。これをJDBCのレイヤで実現してしまうsharding-jdbcというライブラリを見つけました。 github.com sharding-jdbcは中国のdangdang(当当)というEC大手企業が開発したOSSで、SQLをパースし、SQLに含まれるシャードキーを抽出して接続先のデータベースや、参照するテーブルを切り替えてくれるというものです。 使ってみる まずはpom.xmlに以下の依存関係を追加します。 <dependency> <groupId>com.dangdang</groupId> <artifactId>sharding-jdbc-core</artifactId> <version>1.4.1</version> </dependency>
このスライドについて このスライドは、 JJUG CCC 2016 Fall でお話ししたときに使用したスライドです。 自己紹介 opengl-8080 主に Qiita で技術メモを書いたり 関西の SIer 勤務 今日話すこと JPA と DDD の関係について思っていること JPA で DDD のパターンを実装するとどうなるか JPAとDDDの関係で思っていること 最初は、 JPA に対してあまり良いイメージはなかった DDD を学ぶにつれて、徐々にイメージが変わっていった なぜ変わっていったのか、どう変わっていったのか JPAでDDDのパターンを実装 エンティティ・値オブジェクトなどを JPA で実装する 仕様上の限界、実装ごとの現実 JPAとDDDの関係で思っていること JPA へのイメージの変化 DB アクセスライブラリ1との出会い DB アクセスってこうやるのかぁ JPA と
Redash (re:dash) 流行ってますね。 redash.io 最近 Github をにわかに賑わせている OSS が superset です。 github.com superset とは 公式説明によると data exploration platform とのことですが、僕の感覚的にはこれはつまり、いわゆる Business Intelligence (以下 BI) Tool です。そう、Tableau のような。 OSS (Apache 2.0) サーバーサイドは Python で書かれている Flask や pandas、SQLAlchemy などを利用 さまざまなデータソースに対応 (MySQL, Redshift、SparkSQL など) グラフ描画の種類が豊富 Role や Permission についてある程度細かく設定可能 Airbnb Engineering
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く