[B! algorithm] morningriverのブックマーク

MapReduce - naoyaのはてなダイアリー

"MapReduce" は Google のバックエンドで利用されている並列計算システムです。検索エンジンのインデックス作成をはじめとする、大規模な入力データに対するバッチ処理を想定して作られたシステムです。 MapReduce の面白いところは、map() と reduce() という二つの関数の組み合わせを定義するだけで、大規模データに対する様々な計算問題を解決することができる点です。 MapReduce の計算モデル map() にはその計算問題のデータとしての key-value ペアが次々に渡ってきます。map() では key-value 値のペアを異なる複数の key-value ペアに変換します。reduce() には、map() で作った key-value ペアを同一の key で束ねたものが順番に渡ってきます。その key-values ペアを任意の形式に変換すること

morningriver 2008/05/12

リンク

http://www-masu.ist.osaka-u.ac.jp/~kakugawa/lecture/2006/fcs/note/slide1/index.html

morningriver 2008/04/23

リンク

CSDL | IEEE Computer Society

morningriver 2008/03/25

リンク

Libicpc - nya3.jp

libic pc チーム kkntkr / Unknown による、ACM-ICPC 向けのアルゴリズムの実装をまとめたページです。基礎テンプレートマクロ計算ビット演算実数比較幾何基礎データ構造内積・外積回転方向関数射影面積・体積円と円の共通部分多角形の面積交差円と円の交点円と直線の交差判定円と直線の交点凸多角形と線分の包含判定多角形と点の包含判定直線と直線の交差判定直線と直線の交点直線と線分の交差判定線分と点の交差判定線分と線分の交差判定距離最遠点対直線と点の距離直線と直線の距離直線と線分の距離線分と点の距離線分と線分の距離多角形凸包凸多角形のクリッピングその他アレンジメントダイス三次元幾何直線と直線の距離グラフ基礎データ構造最短路 Bellman-Ford Dijkstra Warshall-Flo

morningriver 2008/03/13

リンク

期待値最大化法などのあれこれ - DO++

実装よりの話。近年、Nonparametric Bayes手法が自然言語処理やら機械学習で流行っているのですが測度論とかからスタートするのは大変で、恩恵にあずかりたいがなかなか大変。で教師無し学習で頻出する期待値最大化法(EM法[英語 wikipedia])を使っている場合、そのコードをちょっと変えるとDPを近似できますよというのを実際試してみると結構うまくいく　（ACLのtutorialとかが詳しい）期待値最大化法では、Mステップでを各パラメーターを正規化する部分があるが、 zのパラメータ = C_{z} / \sum_{z'} C_{z'} (C_{z}はEステップで数えたzの出現回数）、ここを zのパラメータ = exp Ψ(C_{z}) / exp Ψ(\sum_{z'} C_{z'}) と置き換えるだけでDirichlet Processを使ったものと同じ効果（大きいクラ

morningriver 2008/03/12

「最近の実装ではlogで表現せずに、そのまま計算して、アンダー/オーバーフローが起きそうになったらリスケーリングするという手法がちらほら見られるようになってきた」

algorithm

リンク

http://www.cs.cmu.edu/~quake-papers/painless-conjugate-gradient.pdf

morningriver 2008/03/11

リンク

Support Vector Machine

最近よく巷で耳にするモノ． SVM， Support Vector Machine，さぽーとべくたーましん．これっていったい，どんなもんなんでしょう．なにやら便利そうなモノらしいので，ちょいと調べて要点をまとめてみようかな，なんて．でも，ただまとめただけだとそのへんの記事を読むのとなんにも変わらないので，コーディングするために必要な知識を中心にまとめてみることにします．

morningriver 2007/09/09

リンク

統計的機械学習(Hiroshi Nakagawa)

統計的機械学習 (under construction) 導入ppt pdf 情報の変換過程のモデル化ベイズ統計の意義識別モデルと生成モデル次元の呪い損失関数, bias, variance, noise 数学のおさらいppt pdf 線形代数学で役立つ公式情報理論の諸概念 (KL-divergenceなど) 指数型分布族、自然共役正規分布(条件付き、および事前分布) 評価方法ppt pdf 順位なし結果の評価(再現率、精度、適合率、F値) 順位付き結果の評価線形回帰と識別ppt pdf 線形回帰正規方程式正規化項の導入線形識別カーネル法ppt pdf 線形識別の一般化カーネルの構築法最大マージン分類器ソフトマージンの分類器 SVMによる回帰モデル SVM実装上の工夫モデル推定ppt pdf 潜在変数のあるモデル EMアルゴリズム変分ベイズ法 Expecta

morningriver 2007/07/12

統計的機械学習の授業資料？

リンク

ワードサラダ技術について

後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である　ということです。さて、実例です。たとえば次の文章を考えてみます。「通信販売大手セシールは９日、生命保険の販売に本格参入する方針を明らかにした。」まず形態素解析するとこんな感じになります。通信名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン販売名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ大手名詞,一般,*,*,*,*,大手,オオテ,オーテセシール名詞,固有名詞,組織,*,*,*,セシール,セシール,セシールは助詞,係助詞,*,*,*,*,は,ハ,ワ９名詞,数,*,*,*,*,９,キュウ,キュー日名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ、記号,読点,*,*,*,*,、,、,、生命名詞,一般,*,*,*,*,生命,セイメイ,セイメイ保険名詞,一般

morningriver 2007/07/11

リンク

2007年第11回PRMUアルゴリズムコンテストトップページ

morningriver 2007/06/18

リンク

[を] Dynamic Programming による類似文字列マッチの実装例

Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを素直に Perl で実装したみた。さらにマッチ箇所取り出しロジックも実装してみた。 DP はいわゆる「類似文字列検索（あいまい検索）」に使うと便利なアルゴリズム。実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二

morningriver 2007/01/23

文字列のDPマッチングについて

リンク

きまぐれ日記: Schwartzian Transform でランダムシャッフル

Schwartzian Transf orm　を使って配列をシャッフルする話をみて、なるほどな～と思いつつも、よくよく考えてみるとこれは2つの意味で駄目です。 1. 計算量が O(n * log(n)) であること。 2.　ランダムにシャッフルできない。 1. は説明するまでもないので、2の理由を考えてみます。まず、rand() が　0..k-1 までの k種類の整数から 1 つ数値を返すものとします。配列のサイズが n の場合、 weightの並びの場合の数は k^n 通り存在します。ところが、配列の順列の場合の数は n! です。ここで何か矛盾点があるように思えてきます。実際に k = 2, n = 2 の場合を考えて見ましょう。この場合、サイズ2の配列をシャッフルするんですから、要素を入れ替える場合と入れ替えない場合が 1/2 の確率で出現するのが正しいシャッフルです。 k =

morningriver 2006/09/01

algorithm

リンク

はてなブックマーク

タグ

関連タグで絞り込む (8)

algorithmに関するmorningriverのブックマーク (12)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス