[B! algorithm] [8ページ] hiromarkのブックマーク

PRML読書会10回: 第8章グラフィカルモデル (前半) - シリコンの谷のゾンビ

PRML読書会第10回に参加してきました．今回は8章グラフィカルモデルの前半を勉強しました．自分が担当した資料 (8.2節条件付き独立性) を公開します． PRML 8.2 条件付き独立性View more documents from sleepy_yoshi. 条件付き独立性では，グラフィカルモデルにおいて，特に有向分離基準と呼ばれる経路遮断の原理から，条件付き独立性について解説しています．今回は内容が平易だったので，きちんと基本的なところから説明するように心がけました．前回，前々回の猛省を少しは活かせたと思っています．その結果，30分で終わるよと宣言して，1.5時間も喋ってしまいました．ベイジアンネットワークの話題では必ずといっていいほど出てくる? "explain away" は本書では「弁明」現象と翻訳されていました．あまりしっくりこなかったのでアンケートを取ることにしま

hiromark 2010/01/27

algorithm

リンク

経路探索アルゴリズムの「ダイクストラ法」と「A*」をビジュアライズしてみた - てっく煮ブログ

as詳解 ActionScript 3.0アニメーション ―衝突判定・AI・3DからピクセルシェーダまでFlash上級テクニックを読んでいて、経路探索のアルゴリズムで A* が取り上げられていました。A* については、いろいろ検索して調べたりもしたのですが、やっぱり本に書いてあると理解しやすいですね。せっかくなので自分流に実装してビジュアライズしてみました。ダイクストラ法まずは A* の特別なケースでもあるダイクストラ法から見ていきます。クリックすると探索のシミュレーションが開始します。スタート地点(S)からゴール(G)への探索が始まります。色がついたところが「最短経路が決定した場所」です。スタート地点から少しずつ探索が完了していきます。半分ぐらい完了しました。まだまだ進みます。最後まで終わりました。最短経路を黒色矢印で表示しています。ダイクストラ法は、スタート地点から近いノード(=マス

hiromark 2010/01/26

あとで

algorithm

リンク

強化学習とは？(What is Reinforcement Learning?)

強化学習の概要，応用上の利点，適用例，基礎理論，代表的手法，応用に必要な技術などの説明。本ページの記述は下記の解説記事をもとにWEB用に修正したものである：木村元，宮崎和光，小林重信：強化学習システムの設計指針，計測と制御, Vol.38, No.10, pp.618--623 (1999), 計測自動制御学会. 6 pages, postscript file, sice99.ps (1.31MB) PDF file, sice99.pdf (148KB) 第１章：強化学習の概要 1.1 強化学習 (Reinforcement Learning) とは? 1.2 制御の視点から見た強化学習の特徴 1.3 応用上期待できること第２章：強化学習の適用例：ロボットの歩行動作獲得第３章：強化学習の基礎理論 3.1 マルコフ決定過程(Markov decision proc

hiromark 2010/01/25

ai
algorithm

リンク

データ圧縮法概説　目次

hiromark 2010/01/18

リンク

PythonでA*(A-Star)アルゴリズム - Pashango’s Blog

今回はA*アルゴリズムをPythonでやってみます。ゲームプログラマの間では、もはや常識となりつつある最短経路問題解決アルゴリズムです。 A*は、古典的手法である「ダイクストラ法」を改良したものです。スタート地点からノードnを通ってゴールに辿り付くとき、最短距離をf(n)とすると、 f(n) = g(n) + h(n) とすることができます、g(n)は「スタートからノードnまでの最短距離」、h(n)は「ノードnからゴールまでの最短距離」です。でも、最初から適切なg(n)とh(n)が判ってるなら苦労しませんよね。だから、テキトーな予測値を使って、最短経路をある程度予測して効率的に経路探索をしてみようという事です。テキトーな予測値を使った最短経路距離をf*(n)とすると f*(n) = g*(n) + h*(n) となります、f*(n)を求めるためにテキトーなg*(n)とh*(n)を

hiromark 2010/01/15

リンク

Xerial Wiki: 課題4 - 2009年度生物情報科学科情報基礎実験

External Sortingを実装する締切：　2010年1月30日　提出先： http://lecture.utgenome.org/exp2009/ このページのアドレス： http://www.xerial.org/wiki/lecture/2009/Report4 ヒント External Merge Sort のアルゴリズム講義資料中のMultiway Merge Sort Chapter 13: External Sorting Raghu Ramakrishnan, Johannes Gehrke. Database Management Systems. 3rd Edition. 入力：タブ区切りのテーブルデータ primary keyとして使う列番号と、データ型(整数、文字列、染色体名、strand)のリスト例：　(配列名, 染色体番号, s

hiromark 2010/01/13

本気でやりだすとこれ実はかなり難しいんだよなあ。

algorithm

リンク

情報生命科学演習ＡｄａＢｏｏｓｔの実装

, , CGED (Cancer Gene Expression Database) http://cged.hgc.jp/ AdaBoost Marcel Dettling and Peter Bühlmann Boosting for tumor classification with gene expression data Bioinformatics, Jun 2003; 19: 1061 - 1069. Jinyan Li, Huiqing Liu, See-Kiong Ng, and Limsoon Wong Discovery of significant rules for classifying cancer diagnosis data Bioinformatics, Sep 2003; 19: 93 - 102. Manuel Middendorf, Anshul

hiromark 2010/01/12

AdaBoost についての解説とか。

リンク

PythonでPLSAを実装してみる

probabilistic latent semantic analysis (PLSA)は、・文書dがP(d)で選ばれる・潜在変数zがP(z|d)で選ばれる・語wがP(w|z)で生成されるというプロセスを経て、結果として(d,w)のペアが観測されるという文書と語の生成モデル。式で表すと (1) となる。P(d,w)の尤もらしい確率分布を見つけたい。対数尤度関数は (2) となる。n(d,w)は語wが文書dに出現する回数。この式は訓練データn(d,w)（;どの語がどの文書に何回出現したか）が尤もらしい確率分布P(d,w)に従うとき最大になる。ベイズの定理を用いると (3) となることを利用して、この尤度関数を最大化するためにEMアルゴリズムを用いて実装してみる。（過学習を回避するために文献ではTempered EM (TEM)を用いている。）尤度関数が収束するまで以下のE-ste

hiromark 2009/12/28

リンク

PFI Christmas seminar 2009

Loading... Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. PFI Christmas seminar 2009 - Presentation Transcript PFIセミナー 2009/12/24 研究開発チームクリスマス・セミナー岡野原大輔何はともあれ、まず Merry X’mas ! こんな日にセミナーをルドルフ達見てくれるのに大感謝だよ投げやりな僕でごめんね僕はサンタじゃないよ今回の発表 • 研究開発チームの活動紹介 • 今注目すべき研究を50分で俯瞰しよう！ – オンライン学習の最前線機械学習 • Multi-c

hiromark 2009/12/25

イブの日に濃い内容だなあｗけど、すごい。

リンク

http://jyoken.net/2005/kenpatsu/enari_oraf/

hiromark 2009/12/25

algorithm

リンク

Probabilistic Latent Semantic Indexing (SIGIR '99)

Next: LSI Probabilistic Latent Semantic Indexing (SIGIR '99) Thomas Hofmann International Computer Science Institute, Berkley, CA & EECS Department, CS Divison, UC Berkeley hofmann@cs.berkley.edu 発表者工藤拓 taku-ku@is.aist-nara.ac.jp 自然言語処理学講座 M1 平成12年7月4日 LSI Aspect Model EM アルゴリズムによるパラメータ学習 PLSI と LSI の比較 U-PLSI,Q-PLSI 実験,結果考察この文書について... Taku Kudo 平成12年7月4日

hiromark 2009/12/25

LSI と PLSI。

algorithm

リンク

アルゴリズムイントロダクション輪講動的計画法の発表資料 - てっく煮ブログ

2009年3月2日に、はてな京都オフィスで開催されたアルゴリズムイントロダクション輪講の第12回で「動的計画法」について発表しました。資料をここにおいておきます。View more presentations from nitoyon.分かりやすくしようと気合を入れてまとめたら165ページの大作になっちゃいました。無駄に長くてすいません。アルゴリズムの設計と解析手法 (アルゴリズムイントロダクション)作者: T.コルメン, R.リベスト, C.シュタイン, C.ライザーソン, Thomas H. Cormen, Clifford Stein, Ronald L. Rivest, Charles E. Leiserson, 浅野哲夫, 岩野和生, 梅尾博司, 山下雅史, 和田幸一出版社/メーカー: 近代科学社発売日: 2007/03メディア: 単行本

hiromark 2009/12/24

長いけどその分隙間がちゃんと埋まっててすばらしいと思った。

algorithm

リンク

[機械学習] トピックモデル関係の論文メモ - tsubosakaの日記

最近読んだトピックモデル関係の論文のざっとしたメモ。内容については間違って理解しているところも多々あると思います。 (追記 12/24) 最後のほうに論文を読む基礎となる文献を追加しました。 Efficient Methods for Topic Model Inference on Streaming Document Collections (KDD 2009) 論文の話は2つあって一つ目がSparseLDAというCollapsed Gibbs samplerの省メモリかつ高速な方法の提案と2つ目はオンラインで文章が入力されるような場合において訓練データと新規データをどう使うかという戦略について述べて実験している。 Collapsed Gibbs samplerを高速化しようという論文はPorteous et al.(KDD 2008)でも述べられているけどそれよりも2倍ぐらい高速(通

hiromark 2009/12/24

リンク

Nonnegative matrix factorization(NMF)でconsensus clustering

NMFを追っかけてたらMetagenes and molecular pattern discovery using matrix factorizationという論文を見つけたので、週末はこの論文を読みながら色々やってみた。NMFの便利なところは元の特徴(この論文の場合は遺伝子発現量)からより少ない任意の特徴量(論文中ではmetagene)に変換できるところであり、さらにそのままクラスターの分割に利用できる。たとえば2つのmetageneで表現した場合、より発現量の大きいmetageneで分割すれば2つのクラスに分けられる。(QSARだったらdescriptorからmeta discriptorが導かれてそれに基づいてクラス分類ができるでしょう) 続いて、重要なのがクラスの安定性である。要するに最適なクラスタの数はいくつなのかということである。これに対して、この論文ではConsensu

hiromark 2009/12/21

リンク

Polynomial Semantic Indexing -- 大規模データからのスケーラブルな距離学習 - 武蔵野日記

午後はNIPS 2009 読み会。 Bing Bai, Jason Weston, David Grangier, Ronan Collobert, Kunihiko Sadamasa, Yanjun Qi and Corinna Cortes, Mehryar Mohri, "Polynomial Semantic Indexing" という論文について紹介してみた。これはtsubosaka さんの日記にすばらしくまとまっているので、内容をあえて繰り返さず(クリアに書かれているので読む価値はあると思う)、感想を述べると、文書と文書の類似度を測る尺度としてこの polynomial semantic indexing はけっこう有用なのではないかな、と思った。@unnonounoさんと@tsubosakaさんも Twitter でつぶやいていたが、これは大規模なデータから低ランク近似して

hiromark 2009/12/16

ir
algorithm

リンク

Advanced Data Structures

6.851: Advanced Data Structures (Spring'07) Prof. Erik Dem aine TA: Oren Weimann [Home] [Lectures] [Assignments] [Project] [Accessibility] Data structures play a central role in modern computer science. You interact with data structures much more often than with algorithms (think of Google, your mail server, and even your network routers). In addition, data structures are essential building blocks

hiromark 2009/12/16

充実してる。

リンク

SACHICA(類似文字列列挙アルゴリズム) - Yasuo Tabeiの日記

SACHICA(類似文字列列挙アルゴリズム)のC++による実装を公開しました。 http://sites.google.com/site/yasuotabei/sachica sachicaは、同じ長さの文字列集合を入力として、ハミング距離がある閾値以下のすべてのペアーを超高速に出力します。　アルゴリズムは、マルチソーティングという手法に基づきます。詳しくは、ハミング距離がd以内で長さがmの文字列集合があったとします。初めに、各文字列をk (> d)の部分文字列のブロックに分割します。今、ハミング距離がd以内の文字列のペアーを求めたいので、もし、ハミング距離がd以内の文字列のペアーが存在すれば、鳩の巣原理により、それらにはk - d個の完全一致するブロックが存在します。この原理に基づき、sachicaはcombination(k, k-d)のすべての組み合わせのブロックをラディックスソ

hiromark 2009/12/15

リンク

計算機科学 – String Matching 文字列照合– (PDF)

計算機科学 – String Matching 文字列照合 – Yoshitsugu Yamamoto 山本芳嗣 3F1007 (029-853-5001), 3E410 (029-853-5395) yamamoto@sk.tsukuba.ac.jp revised January 2006 T [s + 1..s + m] P [1.. m] s+1s s+m T 1 1 定義 Σ：ﬁnite alphabet 有限アルファベット、Σ = {0, 1}, {0, 1, 2, . . . , 9}, {a, b, c, . . . , z} Σ∗ ：set of all ﬁnite length strings of characters in Σ、アルファベットの有限長さの列の全体 T = T[1..n] ∈ Σ∗ ：text、テキスト P = P[1..m] ∈ Σ∗ ：patt

hiromark 2009/12/15

これはうれしい。

algorithm

リンク

Polynomial Semantic Indexing - tsubosakaの日記

NIPS 2009で発表された論文"Polynomial Semantic Indexing" [1]を読んだ。これは低ランク近似を用いた教師ありの情報検索に関する手法である。情報検索について与えられたクエリに関して適当な重みづけをおこなって順位づけして、適切な文章を返却するという問題は古くから研究されている。オーソドックスな方法としては文章をbag-of-wordsで表して各単語の重みをtf-idfで正規化し、クエリに関しても同様な処理を行いコサイン類似度などの距離尺度を使って最も近い何件かを返すというものがある。この方法の欠点としてはクエリの単語を含まない文章はヒットしないという問題がある。これは各単語が独立であるという仮定を行っているためであり、明らかに誤っている仮定である。もう一つの方法としては文章-単語行列が低次元の特徴量によって近似する方法である。代表的な方法としてLS

hiromark 2009/12/14

PSI の解説。勉強してみる。

ir
algorithm

リンク

構築した辞書を元にAho Corasick法を使ってキーワードを探す - yasuhisa's blog

どのようなときにAho Corasick法が必要か辞書構築した後の応用先(?)の一つとして、辞書を元にした転置インデックスを作ることがあげられる。「どのキーワードがどの文章に登場したか」が一番簡単な転置インデックスだと思うんだけど、今回は登場した文章のどの位置にあったかまで記録したい(例えばリンクを張る時に使いたいから)。転置インデックス作るときは、通常形態素解析ベース N-gramベースの2種類が主な手法だと思うんだけど、今回はせっかく構築した辞書をもとに転置インデックスを作りたいので、上の2つではうまくできない。かといって、文章とキーワード総当たりとかやっていたら死ぬので、効率のよい方法が必要。そこでAho Corasick法ですよ、奥さん。はてなキーワードへのリンク処理とかに使われたりします。入力と出力入力と出力を先に紹介しよう。入力は辞書とこんな感じの文章。 <総説誌名>蛋白

hiromark 2009/12/14

AC法って意外とシンプルに書けるんですねー。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (105)

algorithmに関するhiromarkのブックマーク (489)

お知らせ

今週のはてなブックマーク数ランキング（2025年8月第4週）

今週のはてなブックマーク数ランキング（2025年8月第3週）

はてなブックマークは20周年を迎えました

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス