[B! 分散処理] n-3104のブックマーク

n-3104 id:n-3104

分散処理に関するn-3104のブックマーク (3)

データモデル考え中 - 急がば回れ、選ぶなら近道
ただいま社内的に論争中なのでちょっとまとめておく分散環境でのデータモデルはどうあるべきかという議論。分散環境は非同期処理が中心にはなるのだが画面系を中心に同期処理も入ってくるのでその組み合わせを前提に考えないといけない。基本的に外部から変更不能のタイミングが必ずあるというのが、まずは原則論にはなる。分散処理のレイテンシーはこの先下がる一方なのでますます使われるようにはなると思う。その辺りを前提として各考え方のメリット・デメリットをまとめて置きたい。 1プロセス中心指向プロセス・フローを中心にモデル（型）の議論をすべきという考えかた。フローモデルは、プロセス->プロセスが基本で受け渡しをするエッジの部分がデータモデル的位置付けそもそもデータモデル自体は、黙示的に一種の振る舞いを想定するはずなので振る舞いの記述にウェイトを置いた方が良い、という考え方でも
n-3104 2011/10/11
関数型の場合のイメージがわかない。関数はかなり細粒度で作ることになるのだろうか。

アーキテクチャ

分散処理

SOA
リンク
Robust log process
2. はじめに 1. スケーラブルなログ集計を安全に構築するために我々が考慮していることを説明します。 2. 広告集計という特性上、「超高速にかつ高効率に！」というよりはどちらかというと「多少の非効率は目をつぶって安全側に寄せる」という設計方針になっています。 3. 上司から突然「来月から 1 日 10 億越えのアクセスを食うことになるから集計システムはよろしくね♪」という日が来るかもしれないので、来たる日に備えてもらえればと思います。 4. 自己紹介山崎大輔 Twitter: @yamaz Blog : 最速配信研究会 http://d.hatena.ne.jp/yamaz/ 現在：株式会社スケールアウト代表 1 日数億～を超えるような配信をカジュアルに行うための広告配信システム「 ScaleAds 」の開発と販売およびコンサルかれこれオンライン広告業界で 14 年やってます
n-3104 2011/09/21
ログ集計における集計内容ごとの方式の違いについて書かれている。

hadoop

分散処理
リンク
MapReduce以外の分散処理基盤BSP, Piccolo, Sparkの紹介 - Preferred Networks Research & Development
どうも，実は今年から開発チームにjoinしていた中川です．可愛い犬の写真がなかったので，可愛いマスコットの画像を貼っておきます．最近MapReduceとかその実装であるHadoopとかをよく聞くようになりました．これはつまり，それだけ大量のデータをなんとか処理したいという要望があるからだと思います．しかし当たり前ですが，MapReduceは銀の弾丸ではありません．ということで，最近気になっているMapReduceとは違ったアプローチを取っている分散処理基盤について，社内のTechTalkで話した内容を簡単にまとめて紹介したいと思います． Bulk Sychronous Parallel このアルゴリズム自体は1990年に誕生したものです．長いのでBSPと書きます．さて，グラフから最短経路を求める時，MapReduceは使えるでしょうか？このような論文が出るくらいですから出来ないことはあ
n-3104 2011/06/23
いろいろあるんだねー。

分散処理
リンク
1