[B! algorithm] y_mashiroのブックマーク

y_mashiro id:y_mashiro

algorithmに関するy_mashiroのブックマーク (8)

データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します（この論文は@doryokujin君のポストで知りました、ありがとうございます！）。必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
y_mashiro 2011/11/25
algorithm

datamining
リンク
quick sortよりも高速でmerge sortのように安定しているソートアルゴリズムtim sort [勘違い] - Islands in the byte stream
<追記>ベンチマークプログラムに誤りがありました。ソート済のシーケンスに対してソートを掛けていました。ご指摘ありがとうございます＞ak氏そんな夢のようなソートアルゴリズムがあるのかというと、あるらしいんです。それがtim sortと呼ばれるアルゴリズムです。画期的（？）なソートアルゴリズム「Sleep Sort」：濃縮還元オレンジニュース｜gihyo.jp … 技術評論社このあたりで拾ってきたネタですね。 merge sortを改良したアルゴリズムで、安定*1しており、しかも実行速度にも優れているとか。アルゴリズムの性能の評価は済んでいるらしく、CPythonやJDK7には既に導入済みのようですね。ならば当然Perlのソートも…と考えるわけですが、まず評価のためにJavaのソースをC++にそのまま移植してみました。それがこれ（いちおうテスト済）： https://github.co
y_mashiro 2011/10/19
algorithm
リンク
PythonでA*(A-Star)アルゴリズム - Pashango’s Blog
今回はA*アルゴリズムをPythonでやってみます。ゲームプログラマの間では、もはや常識となりつつある最短経路問題解決アルゴリズムです。 A*は、古典的手法である「ダイクストラ法」を改良したものです。スタート地点からノードnを通ってゴールに辿り付くとき、最短距離をf(n)とすると、 f(n) = g(n) + h(n) とすることができます、g(n)は「スタートからノードnまでの最短距離」、h(n)は「ノードnからゴールまでの最短距離」です。でも、最初から適切なg(n)とh(n)が判ってるなら苦労しませんよね。だから、テキトーな予測値を使って、最短経路をある程度予測して効率的に経路探索をしてみようという事です。テキトーな予測値を使った最短経路距離をf*(n)とすると f*(n) = g*(n) + h*(n) となります、f*(n)を求めるためにテキトーなg*(n)とh*(n)を
y_mashiro 2010/08/27
python

algorithm
リンク
人工無能の作り方
書いた人 INA 人工無能とは？人間っぽく話すプログラムのこと。会話を理解しているというよりは、なんかそれっぽいことを話すだけのものが多い。今回は「日本語のようなものを話す人工無能」を作ってみたので、その簡単な仕組みと工夫した点について少し書いてみることにする。動機うちのサークルのメンバーがよく集まってるチャット。とてもマニアックなどうしようもない会話が繰り広げられているわけだが、ちょっと物足りない。そうだ！萌キャラがいないじゃないか！「ないなら作ればいいじゃない？」材料 MeCab 形態素解析エンジン難しいことは知らなくても問題ない。「私は変な人ではない」 ↓ 私名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシは助詞,係助詞,*,*,*,*,は,ハ,ワ変名詞,形容動詞語幹,*,*,*,*,変,ヘン,ヘンな助動詞,*,*,*,特殊・ダ,体言接続,だ,
y_mashiro 2009/02/21
programming

algorithm

人工無能
リンク
d.y.d - instanceof
21:40 06/01/31 修論第一稿submit！やほー！学科内発表も最終稿締め切りもまだまだ先に控えてますが、だいぶ気が楽になりました。塔 Re: Block Tower。同じ直方体を2度通らないという制約が、簡単そうに見えてなかなか厄介に思えます。普通のダイクストラ法なら各頂点でそこまでの最短経路さえ覚えとけば済むんですけど、同じ直方体を２度使わないようにするためには、各頂点ごとに「ある直方体Xを通う最短経路」「使わない最短経路」を両方計算しておく必要があって、それを計算するには「直方体X,Yをどっちも使わない経路」やらなにやら、理論的には最終的に全ての頂点集合2n個について、それを使わない最短経路が入用になったりと。あーでも、実際にはほとんどの「使わない経路」は共有できるからうまくやれば行けるかな？本古くから、風が吹くと桶屋が儲かるとは申しますが、それと
y_mashiro 2009/02/05
programming

algorithm
リンク
Splay Tree
研究上必要があって, 前々からずっと気になっていた, SleatorとTarjanのスプレー木(Splay Tree) [LINK] を実装した。スプレー木は「自己調整(自己組織化)二分木」ともいわれる通り, 頻度の高いアイテムをアクセスの際に木の上の方に自動的に持ってくることで, 高頻度なアイテムへの高速なアクセスを実現する順序木。自然言語の文字列や単語列の頻度は偏りや Power law の固まりなので, 非常に適していると思う。かつ, 最悪の場合でもスプレー木は全体を通して, O(log n) のアクセスを提供することがわかっている。トライを表現するデータ構造としては, 松本研的には Double Array やその実装である Darts がすぐ思い浮かぶと思いますが, Double Array は既に固定されたトライには高速にアクセスできるものの, 新しいノードの
y_mashiro 2008/12/17
algorithm

tree

splay
リンク
スプレー木 - Wikipedia
スプレー木（スプレーき、英: splay tree）は、平衡2分探索木の一種で、最近アクセスした要素に素早く再アクセスできるという特徴がある。挿入、参照、削除といった基本操作を O(log(n)) の償却時間で実行できる。多くの一様でない一連の操作において、その順序パターンが未知の場合でも、スプレー木は他の探索木よりもよい性能を示す。スプレー木はダニエル・スレイターとロバート・タージャンが発明した。 2分探索木の通常のあらゆる操作は、「スプレー操作」という1つの基本操作と組み合わせられる。スプレー操作とは、特定の要素が木の根に位置するよう再配置を行うことである。そのためには、まず通常の2分探索木での要素の探索を行い、次にその要素がトップになるように木の回転を行う。別の方法として、トップダウンアルゴリズムで探索と木の再配置を単一フェーズに統合することもできる。長所と短所[編集] スプレー木
y_mashiro 2008/12/17
algorithm

tree

splay
リンク
Splay Tree Demo
A demonstration of top-down splaying Splay trees, or self-adjusting search trees are a simple and efficient data structure for storing an ordered set. The data structure consists of a binary tree, with no additional fields. It allows searching, insertion, deletion, deletemin, deletemax, splitting, joining, and many other operations, all with amortized logarithmic performance. Since the trees adapt
y_mashiro 2008/12/17
algorithm

tree

splay
リンク
1