[B! algorithm] msyktのブックマーク

Fast Compact Sparse Bit Sets

Imagine you need a relatively compact data structure for quickly checking membership of mostly-consecutive non-negative integers. (If this sounds really specific, it is because it is precisely what I needed for a particular project.) The Ruby standard library contains a Set class which may be a good starting point. Set is actually implemented as a Hash with the Set elements as keys and true as the

msykt 2015/01/14

Sparse BitSetsの解説。分かりやすくてとても良い

algorithm

リンク

When is a bitmap faster than an integer list? – Daniel Lemire's blog

msykt 2014/11/16

さっきのSparse Bitmapの解説記事

algorithm

リンク

GitHub - lemire/javaewah: A compressed alternative to the Java BitSet class

This is a word-aligned compressed variant of the Java Bitset class. We provide both a 64-bit and a 32-bit RLE-like compression scheme. It can be used to implement bit map indexes. The EWAH format it relies upon is used in the git implementation that runs GitHub. The goal of word-aligned compression is not to achieve the best compression, but rather to improve query processing time. Hence, we try to

msykt 2014/11/16

さっきのSparse Bitmapの人、BitSet拡張も書いてる。こっちの方が面白いかな

algorithm

リンク

sparsebitmap/src/main/java/sparsebitmap/SparseBitmap.java at master · lemire/sparsebitmap

msykt 2014/11/16

JavaのSparse Bitmap実装

algorithm

リンク

「木構造と自然数の重複あり集合は等価だよね」というはなし - EchizenBlog-Zwei

「木構造と自然数の重複あり集合は等価だよね」というはなしをする。簡潔データ構造な人向けに言うとLOUDSの話。とはいえこの記事は特に簡潔データ構造の知識を要求しない。データ構造とか情報量とかに興味がある人全般を対象としている。 ※簡潔勢にとっては既知な話のはずなのであえて読む必要はないです。まず結論から述べる。以下のような幅優先で番号を振った木構造を考える。親 → 子 (1) → (2, 3) (2) → (4) (3) → (5)この木構造は以下の重複あり集合によって表現することができる。 { 2, 4, 5, 5, 5 }これだけ書くとなんのこと？と思われるかもしれない。そこでこれから2つのことを説明する。ひとつは「何故、木構造が自然数の重複あり集合で表現できるか」、もうひとつは「重複あり集合で表現することに何の意味があるか」ということ。何故、木構造が自然数の重複あり集合で表現

msykt 2014/02/05

面白いー

algorithm

リンク

クヌース–モリス–プラット法 - Wikipedia

クヌース–モリス–プラット法（Knuth–Morris–Pratt algorithm、KMP法と略記）とは、文字列検索アルゴリズムの一種。テキスト（文字列）Sから単語Wを探すにあたり、不一致となった位置と単語自身の情報から次に照合を試すべき位置を決定することで検索を効率化するアルゴリズムである。このアルゴリズムは1977年、ドナルド・クヌースと Vaughan Pratt および（単独で）J. H. Morris が発明し、3人共同で発表した。本項目では文字列を表すにあたって、0 からインデックスを開始する配列を用いる。従って（後述の）単語 W 内の文字 'C' は W[2] と表される。

msykt 2013/05/12

algorithm

リンク

Skip Lists

Skip Lists は 1990年に William Pugh によって開発されたリスト構造体の一種である。オリジナルの論文は William Pugh, "Skip Lists: A Probablistic Alternative to Balanced Trees", Communications of the ACM, June 1990 となっている。この論文は ftp://ftp.cs.umd.edu/pub/skipLists/skiplists.pdf からコピーを入手可能である。また、Unix Magazine 1999年 1月号を入手できれば、そこには日本語で書かれた解説があるが、これはほとんど論文丸写しに近いので、きっと重宝するだろう。数多くの、要素が増減しなおかつ入れ替わるようなデータ構造で、さらにランダムアクセスが

msykt 2013/01/20

リンク

http://www.cs.columbia.edu/~nahum/w6998/papers/sosp87-timing-wheels.pdf

msykt 2012/07/11

algorithm

リンク

プログラミングコンテストでのデータ構造 2　～平衡二分探索木編～

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learning

msykt 2012/03/29

algorithm

リンク

non-blockingの意味するところ - くまメモ

海外の文献を読み漁っていると気づくのですが 2003年を境にこの文脈で使われる言葉の定義が変わります。 ↑2003年ごろまでの構図 ↑現在の構図。*1 non-blocking = obstruction-free という理解でもおおよそ間違いではないとは思いますが論文を読むに当たって non-blocking = ロックを使わないアルゴリズム全般 obstruction-free = 非lock-freeだけどロックだけはしないというニュアンスの違いを感じます。以後、現在の構図の方を前提に話します。ご注意ください。まずは3つの分類の違いから wait-free 操作が「他のスレッドの動向に関わらず有限ステップで完了できる」場合、そのアルゴリズムはwait-freeと呼ばれます。starvation-freeと呼んだりもします。実際には初めからここに分類されるアルゴリズムは多くあ

msykt 2012/02/12

リンク

Ultimate Sets and Maps for Java, Part I

Highly Scala ble BlogArticles on Big Data, NoSQL, and Highly Scala ble Software Engineering Some time ago our team had been requested to develop several Java components for structured information retrieval. After the initial research, we concluded that standard approaches like inverted indexes are not well applicable to our probl em because of specific business requirements. As a result we faced a ne

msykt 2012/02/10

リンク

Lock-free スナップショットの撮り方を説明してみる - くまメモ

マルチスレッドなどの環境下で時間経過によって勝手に変化する複数の変数を読みたい場面は多くあります。しかしCPUは一度に一つしか値を読み書きできないので、簡単には出来ません。何故なら読んでるそばから値が変動してでたらめな値を読むかも知れないからです。変動してるものを読むのだから読む側が完璧じゃなくても仕方ないという妥協は有り得ますが特定のある一瞬の時刻での状態を写真のようにパチリとフィルムに収められたら嬉しいですよね。一番簡単なのはロックを取りながら読む事ですが、ロックは諸般の事情により使えない事とします。前提値が勝手に変動するという状況が分かりにくいと思うので、適当な例えとして卵の孵化を想像してみましょう。「卵」→「ヒビ」→「ひよこ」　の順でランダムに勝手に進んで行きます。止めることは出来ませんし後戻りもしません。こんな卵が複数ある孵化器の監視を任されたとします。卵の状態

msykt 2012/02/07

リンク

Story of Your Life » Blog Archive » Hopscotch Hashingを実装してみた

動機数年前Cuckoo Hashingも知らないの？と友人から信じられないという目で見られた経験から、いつかCuckoo Hashingを超えるアルゴリズムを実装してやるという(考案してやるという程は高くない)野望を持っていました。そこで今回はHopscotch Hashingを実装してみました。 Herlihy, M., N. Shavit, and M. Tzafrir, “Hopscotch Hashing,” Proceedings of the 22nd International Symposium on Distributed Computing (DISC), pp. 350-364, Arcachon, France, September 2008. Hopscotch HashingはCuckoo Hashingと同様、定数時間での検索を可能にするハッシュテーブ

msykt 2012/02/07

リンク

Parallel worlds of CRuby's GC

The document discusses parallelizing garbage collection (GC) in CRuby. It describes the current single-threaded GC approach and argues for a parallel marking GC to utilize multiple CPU cores. Key points covered include explaining GC concepts like dead objects and roots, an overview of CRuby's mark-and-sweep algorithm, and the motivation to parallelize marking to improve performance. The author has

msykt 2012/02/02

リンク

Arora's Task Stealing Deque

作成日：2005.11.27 目次前置きデータ構造操作擬似コード動作問題点参考文献脚注 1. 前置きマルチプロセッサ上で行う並列処理を行うプログラムが、仕事を均等に N 分割できるものは稀だ。プログラムの処理コストの最大値や平均値を見積もることができても、実際の処理時間や消費メモリはプログラムの実行内容によって大きく変わっていく。そのため各プロセッサに割り当てる負荷(ロード)が均一になるように負荷分散を行うことが重要になる。負荷分散を行うためには、プログラムをある程度の粒度に分割し、プロセッサ間で担当をやり取りできるようにする。とりあえずプログラムを分割したものをタスクと呼ぶことにしよう。タスクをやり取りする方法は、大雑把に言って三つある。マネージャーがいて、どのプロセッサがどのタスクを行うか制御する。暇なプロセッサが、タスクを多く抱えたプロセッ

msykt 2012/02/02

リンク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.

msykt 2012/02/02

リンク

Towards a Scalable Non-Blocking Coding Style（状態遷移機械の設計に関して）

Webinar: Managing the Security and Commercial Impact of Java Updates March 12, 2020 Live WebinarJoin Azul and SoftwareONE for this webinar about the security and commercial applications of Java...Read More dev.next March 24-27, 2020 Broomfield, CO, USAAzul is one of the sponsors at this event which brings together practitioners, experts, and...Read More

msykt 2012/02/02

algorithm

リンク

Cuckoo Hashing - Radium Software

ハッシュテーブルからエントリーを検索する処理は，一般に定数時間で済むとされている。つまり，どんなにエントリーが増えても検索の速さは変わらない，ということ。データ構造の教科書には必ず載っていることだね。でも実際には，ハッシュの衝突が起こった場合に，速度の低下が発生する可能性がある。例えば，一般的なチェイン法（オープンハッシュ）だと，衝突したエントリーに関して線形検索を行うことになるから，衝突が多ければ多いほど，定数時間からは遠のいてしまう。この速度低下を防ぐ方法はいろいろある。なかでも cuckoo hashing （カッコウ・ハッシング）は仕組みが面白い。こいつは，エントリーの検索を必ず定数時間で済ませてくれるという優れものなんだ。 Cuckoo hashing では，２つのハッシュ関数と，２つのテーブルを用いる。ここでは，２つのハッシュ関数をそれぞれ h1, h2 として，２つのテー

msykt 2012/01/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

algorithmに関するmsyktのブックマーク (18)

お知らせ

今週のはてなブックマーク数ランキング（2025年11月第4週）

はてなブックマーク一部機能のメンテナンスに関するお知らせ

今週のはてなブックマーク数ランキング（2025年11月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス