[B! algorithm] starposのブックマーク

Spinlocks and Read-Write Locks

Spinlocks and Read-Write Locks Most parallel programming in some way will involve the use of locking at the lowest levels. Locks are primitives that provide mutual exclusion that allow data structures to rem ain in consistent states. Without locking, multiple threads of execution may simultaneously modify a data structure. Without a carefully thought out (and usually complex) lock-free algorithm, t

starpos 2013/11/21

リンク

Suffix Array を作る - SA-IS の実装

Suffix Array は今若者の間で人気のデータ構造です．マイ suffix array を実装することで，オシャレ度がアップしてモテ系になり，女子力も上がると言われています．その中でも今特に，手軽でクールな SA-IS (アルファベットサイズ固定の下で線形時間で省メモリで suffix array が作れる今最強のアルゴリズム) の実装がブームです．僕もブームに便乗して，実装してみました．ところで，SA-IS は流行っているので，日本語でもすでに様々なところで記事が書かれています (日付順)． SAIS(Suffix Array - Induced Sorting) - EchizenBlog-Zwei SA-IS: SuffixArray線形構築 - sileの日記 SA-IS - (iwi) ｛反省します - TopCoder部接尾辞配列(Suffix Array)の

starpos 2013/03/15

リンク

BWTとInduced Sorting - 気ままなブログ

BWT(Burrows Wheeler Transf orm)を行うプログラムをJavaで書いてみた。一応、Unicodeのサロゲートペアの範囲でも問題なく動くので、あらゆる言語に適応できる。 BWTは、Suffix Arrayから定義に従って構築している。なので、実質的なメモリ使用量や構築時間は、Suffix Arrayのメモリ使用量や構築時間に依存する。 Suffix Arrayの構築にInduced Sortingを使ってみた。参考にしたものを以下に示します。高速文字列解析の世界――データ圧縮・全文検索・テキストマイニング (確率と情報の科学) 作者: 岡野原大輔出版社/メーカー: 岩波書店発売日: 2012/12/27メディア: 単行本購入: 14人クリック: 314回この商品を含むブログ (3件) を見る原文: http://www.cs.sysu.edu.cn/nong/i

starpos 2013/02/25

リンク

ランダムだと！？！？(ガタッ - 西尾泰和のはてなダイアリー

確かに、このテンプレには僕も飽きている： onk:「リンゴが10個あります。ランダムに3人で取り分けなさい」ってどうコードに落とすと綺麗かな。。 yoshiori: @onk ランダムだと！？！？ onk: @yoshiori 擬似ランダムでいいです yoshiori: @onk ふう、焦らせやがって……(俺の中でここまでテンプレ) yoshiori: もう、「ランダム」という言葉に反応してしまうのはネタでも良くない気がしてきたそこで新しいマサカリを考えてみた。「お前はなにを等確率にしたいんだ！？！？」 2個のりんごをAさんとBさんの2人に配ることを考えてみよう。全部で4通りの配り方がある。(A, A), (A, B), (B, A), (B, B)の4つだ。この4通りを等確率にしたいのならば、それぞれのりんごについて1/2の確率でAとBに振り分ければ良い。ちなみにPythonのran

starpos 2013/01/30

algorithm

リンク

Burrows Wheeler TransformとLF mapping - Preferred Networks Research & Development

最近オープンウォーターダイバーのライセンスを取りました。徳永です。今日はBurrows Wheeler Transf orm（BW変換もしくはBWT）の逆変換において用いられるLF mappingを説明します。 BWTはデータ圧縮の前処理などに使われるテクニックです。Burrows Wheeler Transf ormはとても簡単でわかりやすい（高速な実装は複雑ですが……）のですが、逆変換で用いられるLF mappingは、実装は簡単なものの、なぜそれでよいのかは少しわかりにくいところがあります。また、私はこれまで、LF mappingがなぜあれでうまくいくのか、わかりやすい説明を日本語でも英語でも見た記憶がありません。そこで今回はLF mappingを中心に説明します。なお余談ですが、BTWのMichael Burrowsは現在はGoogle勤務で、ChubbyやBigTableなどのソフ

starpos 2013/01/22

とても分かりやすかった．社内勉強会で使わせていただきます．

リンク

ウェーブレット木の世界 - Preferred Networks Research & Development

岡野原です。ウェーブレット木の解説を統数研チャンネルにて行いました。統数研チャンネル（プレミアム会員ならしばらくタイムシフト視聴可能）。ウェーブレット木は万能のデータ構造であり、系列データ、全文検索、グラフ、二次元情報、フィンガープリントなど様々なデータに対して多くの操作をサポートします。本解説では大規模データの背景、ウェーブレット木の作り方、使い方、様々なデータへの適用、最前線（ウェーブレット行列）などを紹介しています。本解説は拙著「高速文字列解析の世界」とあわせてみていただけたらと思います。

starpos 2013/01/16

リンク

Lockfree Queue

Mar 23, 2010Download as PPT, PDF4 likes4,778 views

starpos 2012/02/22

リンク

Network Attached Processing の Pauseless GC

更新履歴 (2005.11.18) 脚注*2を加筆。 (2005.11.17) 文章を推敲。 (2005.11.14) NMT bit の read barrier について嘘を書いていたので修正。目次前置き Pauseless GC Marking Phase Relocation & Remap Phase おしまい参考文献 Azul Sysmtes (米日) は Java や .NET に特化した専用計算機 Network Attached Processing (NAP) を提唱し、製品として Azul Compute Appliance を開発した。 Azul Compute Appliance は、すでに稼動中の Solaris/Linux の J2SE/J2EE システムの Java VM を Azul Systems が提供するスタブ JVM に置き換えるだけで、

starpos 2010/08/21

gc
algorithm

リンク

Run-Length Compressed Suffix Array

This web page will no longer be updated. See the author's web pages for further releases. RLCSA [4, 3, 7] is a compressed suffix array implementation that has been optimized for highly repetitive text collections. Examples of such collections include version control data and individual genomes. This implementation also serves as a testbed for many techniques used with compressed suffix arrays. The

starpos 2010/02/22

リンク

並カンで発表しました - 日記を書く [・w・] はやみずさん

並カン(並列プログラミングカンファレンス)にて、「いいかげんな人のためのTransactional Memory Primer」という題で発表してきました。前日の夜に発表することがきまって、朝から資料を作りはじめたので超いいかげんです。いいかげんな人のためのTransactional Memory PrimerView more presentations from hayamiz. いいかげんな人のためのTransactional Memory Primer

starpos 2010/02/08

すっげー便利そうなのになぁ．2～3倍遅いのかぁ．．．なんか適切なデータ構造とアルゴリズムがまだまだ発展の余地ありな感じもする．

algorithm

リンク

ベイズを学びたい人におすすめのサイト - download_takeshi’s diary

ベイジアンフィルタとかベイズ理論とかを勉強するにあたって、最初はなんだかよくわからないと思うので、そんな人にお勧めのサイトを書き残しておきます。 @IT スパム対策の基本技術解説（前編）綱引きに蛇口当てゲーム？！楽しく学ぶベイズフィルターの仕組み http://www.atmarkit.co.jp/fsecurity/special/107bayes/bayes01.html いくつかの絵でわかりやすく解説してあります。自分がしるかぎり、最もわかりやすく親切に解説してる記事です。数学とかさっぱりわからない人はまずここから読み始めるといいでしょう。茨城大学情報工学科の教授のページから http://jubilo.cis.ibaraki.ac.jp/~isemba/KAKURITU/221.pdf PDFですが、これもわかりやすくまとまってます。初心者でも理解しやすいし例題がいくつかあ

starpos 2009/05/28

リンク

レコメンデーションとエディットグラフ

レコメンデーションとエディットグラフ：コーディングに役立つ！アルゴリズムの基本（10）（1/4 ページ）プログラマたるものアルゴリズムとデータ構造は知っていて当然の知識です。しかし、教科書的な知識しか知らなくて、実践的なプログラミングに役立てることができるでしょうか（編集部）実際のアプリケーションで使われるアルゴリズムこれまで見てきたアルゴリズムは、実際のアプリケーション開発の際にそのまま使われることはあまりなく、プログラム言語やライブラリなどですでに機能が用意されているものが大半でした。今回は最終回ということで、実際のアプリケーション開発でそのまま使えるものを紹介したいと思います。レコメンデーション ECサイトで、「あなたにお勧めの商品」を表示していることがあります。いろいろなデータベースや行動履歴のデータから、その人ごとにお勧めの商品をはじき出して推薦する機能をレコメンデー

starpos 2009/05/28

リンク

Google の秘密 - PageRank 徹底解説

INDEX はじめに PageRank の基本概念どうやって PageRank を求めるか現実に適用する際の問題 Namazu での実装実験 PageRank に対する個人的見解参考文献おまけ：「グーグル？／ゴーグル？」 Since: Thu Feb 1 18:22:44 JST 2001 Last Refreshed: Sat Jan 24 18:30:35 JST 2004 ★(2004/1/24) Yuan Huanglin氏によって本ページの中国語訳が作成されました。 ★(2003/7/1) 拙著『Namazuシステムの構築と活用』を改訂しました。詳しくはサポートページをご覧ください。 ★(2003/5/20) Google に関するオンラインニュース記事一覧(日本語記事のみ)を別ページ(googlenews.html) として分離しました。 ★(2001/2/

starpos 2009/01/11

リンク

GC - GCアルゴリズム詳細解説 - livedoor Wiki（ウィキ）

GCアルゴリズム詳細解説日本語の資料がすくないGCアルゴリズムについて詳細に解説しますトップページページ一覧メンバー編集 × GC 最終更新： author_nari 2010年03月14日(日) 20:47:11履歴 Tweet このWikiが目指す所 GCとは？ GCを学ぶ前に知っておく事実行時メモリ構造基本アルゴリズム編 Reference Counter Mark&Sweep Copying 応用アルゴリズム編 IncrementalGC 世代別GC スナップショット型GC LazySweep TwoFinger Lisp2 Partial Mark and Sweep -Cycle Collection- Mostly Parallel GC train gc MostlyCopyingGC(Bartlett 1989) TreadmillGC(Barker 1992)

starpos 2008/12/14

結構集積された情報のようだ

リンク

高速かつ省メモリで文字列を扱うデータ構造「wavelet tree」

はじめに大規模なデータを扱うアプリケーションでは、速度とともに作業領域量も大きな問題となります。作業領域がメインメモリに収まらない場合、スワッピングが発生し、大幅な速度低下につながります。そのため近年、データ構造は高速なだけでなく、作業領域量が小さいことも求められています。今回紹介するのは2003年に提案されたデータ構造、wavelet tree（以下「WT」と表記）です。WTは圧縮索引やSuccinct Data Structureなど、データをコンパクトに表現する際に重要なデータ構造です。WTは文字列T[0...n-1]が与えられた時、次の2つの操作を定数時間でサポートします。 rank(p, c)――T[0...p]中のcの出現回数を返す select(i, c)――(i+1)番目のcの位置を返す WTの作業領域量は、文字列をそのまま保存した時の約2倍程度です。対象読者 C++の

starpos 2008/11/30

algorithm

リンク

DO++ : 最長一致文字列の話

たまには自分の研究紹介 D. Okanohara, K. Sadakane. "An Online Algorithm for Finding the Longest Previous Factors". In the 16th European Symposium on Algorithms. Sep 2008. to appear. [pdf(draft)] この研究では文字列を順々に読んでいったとき、各位置で過去に一番長くマッチした部分文字列を報告する問題を扱ってます。圧縮のLZ77法を知っているなら、マッチする部分を見つける部分を解いてます。で、圧縮以外にもいろいろなパターンマッチング問題とか、インデクシングとか、データマイニングとかいろいろなことにこの情報が利用できるということが知られてるみたいです。で、大抵はハッシュやtrieを組んで履歴を探すんですが、今回対象にするのはテキ

starpos 2008/07/05

suffix tree的な話。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (15)

algorithmに関するstarposのブックマーク (16)

お知らせ

月間はてなブックマーク数ランキング（2025年7月）

今週のはてなブックマーク数ランキング（2025年7月第4週）

今週のはてなブックマーク数ランキング（2025年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス