bojovsのブックマーク - はてなブックマーク

続々・リトライと冪等性のデザインパターン - あらゆる操作を冪等にする方法 - Blog by Sadayuki Furuhashi

いつも心に冪等性。古橋です。リトライと冪等性のデザインパターンの完結編です。だいぶ間が空いてしまいましたが！最後に冪等性を実装する汎用的な実装手法についてまとめていきます。パターン６：操作ログとリクエストIDでUPDATEを冪等にする同じIDで識別される値がUPDATEされる場合、つまりmutableである値の管理は、一般に冪等に行うのが難しい。例えば、ユーザーごとに「最後に購入したアイテム」を更新する操作を考えてみると： 1. ユーザーAが最後に購入したアイテムをアイテム1に変更する（UPDATE） 2. ユーザーAが最後に購入したアイテムをアイテム2に変更する（UPDATE）この操作に何の対策もなくリトライを実装した場合、後続のUPDATE処理の結果を古い内容で上書きしてしまう可能性がある： 1. ユーザーAが最後に購入したアイテムをアイテム1に変更する（UPDATE）→

bojovs 2017/08/10

programming

リンク

Re: 論理削除はなぜ「筋が悪い」か - Blog by Sadayuki Furuhashi

Kazuhoさんの論理削除はなぜ「筋が悪い」かを読んで。 UPDATEが発生しないテーブルならば、削除フラグを使った実装手法でも現在の状態と更新ログを別々に表現でき、結果として効率と過去の情報を参照できるメリットを簡潔に両立できるのではないか、という話。大前提として全く同意なのだけども、今あるテーブルにdeleted_atを足すだけで、過去のレコードを復旧可能なようにしたい＞＜みたいに思っちゃった僕のような人間が実際に取るべき実装手法は何か、あるいは、それを想定して今やっておくべきテーブル設計はどういうものか！？というのが最後の疑問。まずUPDATEがなければ、immutableなマスタ、更新ログ、「現時点のビュー」の３テーブルは、例えば次のようになる（PostgreSQLの場合）： -- immutableなマスタ。 create table records ( id serial

bojovs 2015/03/26

database

リンク

並列データ転送ツール『Embulk』リリース！ - Blog by Sadayuki Furuhashi

こんにちは。古橋です。先日の*1 データ転送ミドルウェア勉強会で、新しいオープンソースツール Embulk をリリースしました。 Embulk, an open-source plugin-based parallel bulk data loader from Sadayuki Furuhashi Embulk は、リアルタイムなログ収集では常識となった fluentd のバッチ版のようなツールで、ファイルやデータベースからデータを吸い出し、別のストレージやデータベースにロードするためのコンパクトなツールです。 fluentd と同様にプラグイン型のアーキテクチャを採用しているため、RubyやJavaで簡単なコードを書くことで、様々なファイルフォーマットやストレージに対応することができます。一方で fluentd とは異なり、高速性やトランザクション制御、スキーマを使ったデータのバリ

bojovs 2015/02/17

embulk

リンク

イベントログ収集ツール fluent リリース！ - Blog by Sadayuki Furuhashi

こんにちは。Treasure Data の古橋です^^; 先日の Treasure Data, Inc. 壮行会で、イベントログ収集ツール fluent をリリースしました！ Fluent event collector fluent は syslogd のようなツールで、イベントログの転送や集約をするためのコンパクトなツールです。ただ syslogd とは異なり、ログメッセージにテキストではなく JSON オブジェクトを使います。またプラグインアーキテクチャを採用しており、ログの入力元や出力先を簡単に追加できます。 Twitterでも話題沸騰中です：イベントログ収集ツール #fluent 周りの最近の話題背景「ログの解析」は、Webサービスの品質向上のために非常に重要です。Apacheのアクセスログだけに限らず、アプリケーションからユーザの性別や年齢などの詳しい情報を集め

bojovs 2011/09/29

fluentd

リンク

Webサイトをgithubで管理してpush時に自動的に同期する方法 - Blog by Sadayuki Furuhashi

Webサーバに Subversion のサーバを立てておき、HTML や CSS を commit することでWebサイトを更新する方法は、良く知られているテクニック、らしいですね*1。更新の履歴を残すことができるし、ましてチマチマとFTPやsftpでアップロードするよりずっと簡単です。しかし SVN の代わりに git を使おうとすると、pushしてもリポートリポジトリではファイルを更新してくれません。また、リポジトリはWebサーバ上に作るよりも、便利な管理インタフェースがある github（や噂のgitosis）に置いておきたいところです。そこで、github の Post-Receive Hook を使うと、リポジトリに変更を push すると同時に、Webサーバにも同期させることができます*2。 Webサーバに同期する前に、Sphinxでドキュメントを整形したり、SassをC

bojovs 2011/04/03

github
git

リンク

WebSocketサーバライブラリ rev-websocket リリース - Blog by Sadayuki Furuhashi

いま WebSocket がにわかに注目を集めているようです。ブラウザとサーバの間でリアルタイムな双方向通信を実現する機能で、HTML5に追加された（される予定の）新しい仕様です。このWebSocketを使うには、ブラウザ側のJavaScriptの記述だけでなく、サーバ側の実装も必要になります。そこで、Rubyで使えるWebSocketのサーバライブラリ rev-websocket をリリースしました。 gemでインストールできます：gem install rev-websocket 早速、デモアプリケーションを作ってみました：シャウッたー　*1 WebSocket を使ったチャットシステムに、ちょっとした演出を加えたシンプルなアプリケーションです。速くタイプするほど大きく表示されるという趣向です^^; WebSocket に対応しているブラウザは今のところ Safari と Chr

bojovs 2010/07/18

リンク

ニコニコ動画、分散Key-valueストア「kumofs」を導入 - Blog by Sadayuki Furuhashi

つい先日、ニコニコ動画モバイルの一部でkumofsを導入したというお話を伺いました。まだまだ利用は一部でしか始まっていないようですが、これからデータを取りながら運用実績を作っていきたいとのことでした。 kumofsは、バージョン0.3.3でflagsの保存に対応し、バージョン0.3.5でexpireに対応しています。バージョン0.3.4では、Javaクライアントとの互換性を改善しています。これらの機能の改善に加えて、運用実績やノウハウの蓄積も、オープンソースソフトウェアとして重要な要素の1つと言えます。 kumofs関連資料まとめや #kumofs@twitter にも、ぜひ注目してみてください^^; kumofsは既に、写真ストレージサービス Ficia（フィシア）での運用実績があります。（ITproニュース）ドワンゴ研究開発ブログ分散Key-Valueストア「kumofs

bojovs 2010/05/06

リンク

第101回カーネル読書会 - Blog by Sadayuki Furuhashi

先日楽天タワーで開催された第101回カーネル読書会で、分散KVS kumofs の設計と実装に関して発表しました。少々準備不足で十分な発表ができたか不安ではありますが、懇親会で大いに議論が盛り上がったのは良かったです。そんなわけで、発表資料を公開しました。 kumofsの実装（PDF）クリックで進むムービー版 Keynoteファイルデモ用コードデモ用のコードをいくつか用意していたので、ここに掲載します。エラー処理などなどはテキトーですが、とりあえず動きます。 MessagePackシリアライズ（C++） kumofsで利用しているシリアライズライブラリMessagePackを使って、オブジェクトをシリアライズするコードです。シリアライズした結果は標準出力（ファイルディスクリプタ1番）に書き出します。 #include <msgpack.hpp> #include <unist

bojovs 2010/03/02

kumofs

リンク

モダンネットワークプログラミング入門 WEB+DB PRESS vol.55 - Blog by Sadayuki Furuhashi

先日も少し書きましたが、WEB+DB PRESS vol.55 で特集記事を執筆させていただきました。本日発売です。タイトルは、モダンネットワークプログラミング入門です。マルチコアCPUから最高の性能を引き出す本特集では，マルチコアCPUの性能を存分に引き出し，大量のクライアントからの莫大な数のアクセスにさらされても，常に爆発的な性能を発揮する先進的なネットワークプログラムの書き方を，実践的な実装パターンとしてやさしく解説します。 WEB+DB PRESS vol.55 特集3 弾さんの連載最終回は、えとらぼの皆さんです^^; 目次第1章：ネットワークプログラミングの基礎知識なぜいま「ネットワークプログラミング」なのか第2章：ソケットAPI ネットワークプログラミングの基本を押さえる第3章：ネットワークプログラムのI/O戦略非同期，並列，イベント駆動，マルチスレッド第4章

bojovs 2010/02/24

リンク

kumofsはなぜスケールするか - Blog by Sadayuki Furuhashi

先日、分散Key-valueストア kumofs を公開しました。多く方から反響とフィードバックをいただいています。ありがとうございます。今回は、kumofs はなぜスケールするのか、なぜスケールすると言えるのかーということについて紹介したいと思います。ところでスケーラビリティとは何か？スケーラビリティとは、利用者や仕事の増大に適応できる能力・度合いとされています（端的！）*1 。Scalability を日本語にすると、拡張性と訳されるようです。ただ一口でスケーラビリティと言っても、様々な側面があります。ITシステムでは主には処理性能と運用に関することを指す場合が多いと思いますが*2、その中にも様々な側面があります。なぜスケーラビリティが必要かスケーラビリティはシステムなどが持つべき望ましい特性であって、高いに越したことはありません。しかし、高いスケーラビリティはタ

bojovs 2010/01/27

リンク

分散Key-Valueストア「kumofs」を公開しました！ - Blog by Sadayuki Furuhashi

分散Key-Valueストア kumofs を、本日オープンソースソフトウェアとしてリリースしました！ kumofs@SourceForge kumofs関連資料まとめ kumofsとは？ kumofs（クモエフエス）は、実用性を重視した分散データストアです。レプリケーション機能を備え、一部のサーバーに障害が発生しても動作し続けます。単体でも高い性能を持ちながら、サーバーを追加することで読み・書き両方の性能が向上する特徴を持ち、低コストで極めて高速なストレージシステムを構築・運用できます。 kumofsの大きな特徴は、システムの構成の簡単に変更できる点です。システムを止めることなく、簡単な手順でサーバーを追加したり復旧したりできます。アプリケーションには一切影響を与えません。またkumofsは、広く利用されている分散キャッシュシステムの「memcached」と互換性のあるプロトコルを実装

bojovs 2010/01/18

kvs
kumofs

リンク

54行で分散KVSを実装する（レプリケーション機能付き） - Blog by Sadayuki Furuhashi

Ruby と MessagePack-RPC があれば、簡単なkey-valueストレージは簡単に作れます。54行で書けます（レプリケーションと負荷分散機能付き。サーバー38行、クライアント16行）。簡単なKVSをベースにして、ログ集計や遠隔デプロイ、遠隔管理機能などの機能を追加していけば、ちょっと便利なサーバープログラムをサクサク自作できるハズ。この分散KVSは、（keyのハッシュ値 % サーバーの台数）番目のサーバーにkeyを保存します。また、サーバーの名前順でソートしたときの「次のサーバー」と「次の次のサーバー」にデータをレプリケーションします。すべてのサーバーで同じ設定ファイルを使います。サーバーごとの設定は引数を自分のホスト名に書き換えるだけなので、デプロイが容易です。 MessagePack-RPC for Ruby を使うと、分散しないkey-valueストレージ*1は

bojovs 2009/11/27

kvs
ruby

リンク

『クラウドの技術』 - Blog by Sadayuki Furuhashi

藤本さんや首藤さんにお誘いいただいて、コラムの執筆を担当させていただきました。内容はkumofsについて、特に全体のアーキテクチャと耐障害性についての技術解説です。『クラウドの技術』は、クラウド関連の要素技術について丁寧にまとめられていることが人気を呼んだ末に、今では入手困難となってしまったという噂の UNIX Magazine 2009年 4月号の特集を再編集し、さらに多くの新しい記事を加えたものになっています。目次は以下の通りです： [最新・クラウドプレイヤーたちのサービス] ・Windows Azureの世界（丸山不二夫）・Windows Azure Tableの概要（丸山不二夫）・Google App Engine（中田秀基）・Amazon Web Services（浦本直彦）・Amazon Web Servicesを取り巻く技術とサービス（浦本直彦）・富士通のト

bojovs 2009/11/09

book

リンク

PFIインターンに行ってきました。 - Blog by Sadayuki Furuhashi

8月1日から8月31日までの１ヶ月間、PFI夏期インターンに行ってきました。はてなインターンの講義・課題・チーム形式とは趣を異にして、個々人が何か１つのプロジェクトに取り組む方針で進みました。取り組むテーマは新たに取り組みたい/今取り組んでいる内容を前提に、既存の問題の中から近いテーマを見つけます（あるいはこじつける^^;）。インターンの期間中の１ヶ月か２ヶ月の間に成果を出すのが目標！取り組むテーマはスムーズに決まりました。何か自社で製品を作っていれば普通かと思いますが、探せば問題はいくらでもあるモノです^^ ちなみにPFIの製品は、全文検索エンジンやレコメンドエンジンなどです。私は以下の４つのプログラムを実装しました：既存の実装に代わるRPCフレームワーク MessagePack-RPC for PFI クラスタ管理ツール clx プロセス管理ユーティリティ daemo

bojovs 2009/09/09

pfi
intern

リンク

追記型オブジェクトストレージ「Kastor」（pre-alpha） - Blog by Sadayuki Furuhashi

Facebookで写真配信のために使われているストレージシステム「Haystack」に関する情報が公開されました。（Needle in a haystack: efficient storage of billions of photos） Facebookは最初はNFSを使っていたようです。しかし写真の1枚1枚をファイルとして保存していたため、ディレクトリエントリなどのinodeメタデータの総量がキャッシュに収まらないサイズになってしまい、一つの写真を保存したり取り出したりするのにHDDのシークが複数回発生していたのがボトルネックになっていたそうです。（もしかしたら「NetAppは高すぎた」のがもっと重要だったかも知れません：Facebook、独自の写真配信ネットワーク、Haystackを完成―収益性の改善に寄与か？）シークの問題を軽減するために、profile用などの小さな写真はキ

bojovs 2009/05/27

リンク

はてなブックマーク

タグ

ブックマーク / frsyuki.hatenablog.com (15)

お知らせ

今週のはてなブックマーク数ランキング（2024年12月第4週）

「あとで読む」タグで振り返る2024年〜今年の「あとで読む」、今年のうちに〜

今週のはてなブックマーク数ランキング（2024年12月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / frsyuki.hatenablog.com (15)

お知らせ

今週のはてなブックマーク数ランキング（2024年12月第4週）

「あとで読む」タグで振り返る2024年 〜今年の「あとで読む」、今年のうちに〜

今週のはてなブックマーク数ランキング（2024年12月第3週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス

「あとで読む」タグで振り返る2024年〜今年の「あとで読む」、今年のうちに〜