次へ: 序 論 有限混合分布モデルの学習に関する研究 (Web 版) 赤穂 昭太郎 2001 年 3 月 15 日学位授与(博士(工学)) 序 論 研究の背景と位置づけ 論文の構成 有限混合分布とその基本的性質 定義 モジュール性 階層ベイズモデルとの関係 パラメトリック性とノン... 続きを読む
ダブル配列のライブラリを公開しているページです. An Implementation of Double-Array Trie URL: http://linux.thai.net/~thep/datrie/datrie.html Darts: Double-ARray Trie System URL: http://chasen.org/~taku/software/darts/ Dame URL: http://www.void... 続きを読む
Managing Gigabytes勉強会で転置インデックスの圧縮の話が出たので実際に圧縮を行った場合にどれくらいのサイズになるかを計測してみた。利用したデータは英語版Wikidiaの全記事で文書数2,872,589単語数2,735,620転置インデックスのポインタの数397,603,176ぐら... 続きを読む
[an error occurred while processing this directive] 最強最速アルゴリズマー養成講座:オーダーを極める思考法 (1/3) プログラムの実行に掛かる時間を把握しておくのは、プログラミングを行う上で基本的な注意点です。今回は、計算量のオーダーについて学び... 続きを読む
Darts: Double-ARray Trie System はじめに Darts は, Double-Array [Aoe 1989]を構築するための シンプルな C++ Template Library です. Double-Array は Trie を表現するためのデータ構造です. ハッシュ木, デジタルトライ, パトリシア木, Suffix Array によ... 続きを読む
このところ立て続けに表記の事実を理解していない俺実装のHash(しかもCで!)を見かけたので、おそらく知られていないんだと思う。以降、同じ轍を踏む人が少なくなればと思い、啓蒙のために公開しておく。 先に言っておくが おまえらはHashを再発明するんじゃねよ... 続きを読む
ダイクストラ法が小さなサンプルデータで動いたら、実際のデータを使ってみたくなるのが人情。東京を走る地下鉄のデータでやってみたいと思った。JavaScriptとPrototype.jsとGoogleMapsAPIとすったもんだしたあげく、なんとか動くものができた。東京を走る路線... 続きを読む
17:12 08/10/24 アルゴリズムコンテストの挑み方 (2) 第一回はこちら。シリーズ化なんて考えてなかったんですけど、まあ勢いで。 さて許される計算量のオーダーは推測できた、ではアルゴリズムを考えよう……、 という時に、自分はどうも3種類くらいの方法でア... 続きを読む
2009年3月2日に、はてな京都オフィスで開催された アルゴリズムイントロダクション輪講 の第12回で「動的計画法」について発表しました。資料をここにおいておきます。View more presentations from nitoyon.分かりやすくしようと気合を入れてまとめたら165ペー... 続きを読む
検索における適合率 (Precision) と再現率 (Recall) 2008-01-17-1 [IIR] 「Introduction to Information Retrieval」[1] の輪講の 第一回[2008-01-12-1]でちらっと話しましたが、 第一章の 1.1 に Precision と Recall の説明があります (第八章でも出てきます... 続きを読む
先日書いた機械学習における距離学習の続き。kNN (k-nearest neighbour: k 近傍法)は Wikipedia のエントリにも書いてある通り、教師あり学習の一つで、あるインスタンスのラベルを周辺 k 個のラベルから推定する手法。memory-based learning と呼ばれることも... 続きを読む
ruby | 00:51 | 「ぼくゴリラ ウホホイウッホ ウホホホホ ウッホホウッホ ウホホホホーイ」第57回左千夫短歌大会の市長賞作品に感動が押さえきれないので、ウホホ変換スクリプトを組むことにした。まず元作品から状態遷移図を作成。矢印のそばにある数字... 続きを読む
新年すっかりあけてました。 今年もよろしくお願いします。 年末年始はドタバタして昨年を振り返られなかったのですが、せっかくなので2008年に読んだ論文で私個人のベスト5を以下に列挙してみます。 D. Sontag, et. al. "Tightening LP Relaxations for MAP u... 続きを読む
AlgorithmK-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点... 続きを読む
ベイジアンネットワーク構築支援システム BayoNet Bayesian Network Construction System ● BayoNet(ベイヨネット)とは大量のデータから依存関係を抽出し、分かり易いイ ンターフェースでベイジアンネットを構築するソフトウェアです。 構築の過程を画面で確... 続きを読む
Machine learning is often computationally bounded which implies that the ability to write fast code becomes important if you ever want to implement a machine learning algorithm. Basic tactical optimizations are covered well elsewhere, but I h... 続きを読む
先日のエントリに載せたコードは,似たものを探すアルゴリズムを切り換えることができる。top_matches も get_recommendations もパラメータの最後にアルゴリズムに使うメソッド名をシンボルとして渡せる。デフォルトでは sim_pearson が使われるが,ブックマー... 続きを読む
INDEX はじめに PageRank の基本概念 どうやって PageRank を求めるか 現実に適用する際の問題 Namazu での実装実験 PageRank に対する個人的見解 参考文献 おまけ:「グーグル?/ゴーグル?」 Since: Thu Feb 1 18:22:44 JST 2001 Last Refreshed: Sat Jan 24... 続きを読む
2007/08/15 検索サービスを提供するベンチャー企業のムーターは8月1日、辞書を必要としない形態素解析エンジン「マリモ」の提供を開始した。従来、形態素解析では品詞情報を含む日本語辞書を用意するのが常識だったが、マリモでは、そうした辞書を不要とした。... 続きを読む
Bayesian Setとは集合D_Cが与えられたとき、そこから「類推」して、元の集合C⊃D_Cに入る元xを(「自信」の度合いを表す数値つきで)求めるというもの。ただし、D_Cの元やxは特徴データ{c_i}をもっているとする。で、原論文を読むとΓ関数がずらずらでてきておどろ... 続きを読む
イケてないプログラム(使えない成果物)に見られる3つの共通点 クイックソートの話で書いたとおり、相変わらず Excel - VBA と格闘する日々が続いております・・・orz 「大企業にありがちな問題。委託開発の甘い罠・・・」でも書いたとおり、今まで外注して作... 続きを読む
無向グラフ スケジューリング 量子計算(グローバーのアルゴリズム) 最小カット 投票力指数 (CGI) チャネル割当問題 共有区間列挙問題(CGI) 2次元ボロノイ図構成 グラフエディタの作成(群馬大学 中野研究室) 辺連結度増大アルゴリズム 3次元凸包 グラフ分... 続きを読む
「アルゴリズム(algorithm)」は、何らかの目的を果たすための手順や方法です。開発の世界では、数行のプログラムから大きなシステムに至るまで、大小さまざまなアルゴリズムが存在します。 現在では、便利なライブラリが各種提供されているため、自分で作成... 続きを読む
図1に示すHTML形式のテキスト・データ(以下,HTMLデータ)があります。このHTMLデータをブラウザに表示させたときに「表示される文字列」と「その文字列に対して有効なタグ名」を対応付けるアルゴリズムを考えてください。結果は配列に格納して,画面に表示さ... 続きを読む
はてなブックマーク - 「Javaによるアルゴリズムとデータ構造」を含むブックマーク (1) 2007年03月29日syou6162 続きを読む
C言語標準ライブラリの乱数rand( )は質に問題があり、禁止している学会もある。 他にも乱数には様々なアルゴリズムがあるが、多くのものが問題を持っている。 最も多くの人に使われている乱数であろう Visual Basic の Rnd の質は最低である。 そもそも乱数と... 続きを読む
The Sorting Algorithm Demo Sorting Algorithms The animations on this page illustrate a number of different sequential and parallel sorting algorithms. The relative execution times of the animations give a very rough idea of the relative speed... 続きを読む
BibTeX | Add To MetaCart @INPROCEEDINGS{Charikar02findingfrequent, author = {Moses Charikar and Kevin Chen and Martin Farach-colton}, title = {Finding frequent items in data streams}, booktitle = {}, year = {2002}, pages =... 続きを読む
HOME - ARCHIVE - ABOUT - RSS 2006-10-03 問: テーブルを使わずに 32-bit のビットパターンを逆順に並べ替える最短の手順は? 答例: x = ((x & 0xaaaaaaaa) >> 1) | ((x & 0x55555555) << 1); x = ((x & 0xcccccccc) >> 2) | ((x & 0x33333333) << 2); x = (... 続きを読む