タグ

algorithmに関するtoru-kanimisoのブックマーク (3)

  • ヒープ - Wikipedia

    親要素が常に2つの子要素より大きくならない(またはその逆)構造になっている。 挿入、削除がO(log n)で可能。探索は。 ルートが常に最小(または最大)要素となっているので、ルートの削除を繰り返すことで、ソートを行うことができる。 このときの計算量は。(ヒープソート) 木の高さの低い方(または深さの浅い方)から、また同じ高さでも左または右のどちらかに要素を寄せた木構造を作る。深さ の要素がすべて使われるまで、深さ の要素は作成しない。要素の添字を 1 から開始すると、要素 の親は 、子は および となる(添字を 0 から開始すると親は 、子は と である)。 後述する手順に従って操作すれば、データの出現順序に関わらず、このような構造を容易に維持できることがヒープの利点である。 構造の節で述べたように、任意の要素に対する親要素と子要素は添字の計算で特定することができる。また要素が存在するか

    ヒープ - Wikipedia
  • たのしいPython ダイクストラ法ですべての最短経路を求める

    Author:辻真吾(つじしんご) www.tsjshg.info いまは、大学の研究室を主な拠点に、色々やってます。このブログはPythonの話題が中心ですが、どちらかというと日々の仕事で使う知識を、自分のためにメモしたものです。万が一どなたかの役に立てば光栄です。 最近の記事 macでタブレット使う時はInkをOFFに (02/20) SSDで無音NASを作ってみた (12/26) Pythonで学ぶアルゴリズムとデータ構造(講談社) (08/31) Visual Studio CodeのTexでスニペット (12/05) macOS Sierraでsudoしているのに、Operation not Permittedとか言われる件 (10/21) 最近のコメント 辻真吾(つじしんご):ダイクストラ法ですべての最短経路を求める (08/02) 師子乃:ダイクストラ法ですべての最短経路を求

  • MySQLでTF-IDFの計算、あと2つのベクトルの内積の計算 (2006-12-19)

    文を形態素分解し、必要な品詞をtfテーブルとdfテーブルに入れる。分析対象となる文書群すべてについてこの処理を行い、各形態素のTF-IDF値を求めて文書をベクトル化する。他の文書ベクトルと内積を比較し、小さい順に「似ている記事」を求めたい (クラスタリングとかは別途)。 HarmanによるTF値の正規化とSparok JonesによるDF値の正規化をする場合のTF-IDF値の計算式は以下のようになる (参考文献): tfidf(i,j) = log2(freq(i,j) + 1) / log2(NoT) * (log2(N / Dfreq(i)) + 1)

  • 1