タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

algorithmとphpに関するyo_wakaのブックマーク (3)

  • PageRank In PHP

    Google was a better search engine than it’s predecessors for a number of reasons, but probably the most well known one is PageRank, the algorithm for measuring the importance of a page based on what links to it. Though not necessarily that useful on its own, this kind of link analysis can be very helpful as part of a general information retrieval system, or when looking at any kind of network, suc

    PageRank In PHP
  • TinySegmenterのphpを改造してみる。 - お前の血は何色だ!! 4

    TinySegmenter っていうjavascriptで実装されている分かち書きソフトがある。 これの php 版があるんだけど、文字の切り出しに mb_strsub を使っているのと、@でエラー抑制をしていたので少し書き換えてみた。 ついでに、私はUTF-8しか使わない予定なので、専用に改悪してしまったけど、こんな感じになった。 <?php /* PHP Version of TinySegmenter (http://chasen.org/~taku/software/TinySegmenter/) TinySegmenter is super compact Japanese tokenizer. TinySegmenter was originally developed by Taku Kudo <taku(at)chasen.org>. PHP Version was dev

    TinySegmenterのphpを改造してみる。 - お前の血は何色だ!! 4
  • 棚からパルチャギ

    実践編です。 ベイジアンフィルタを使ったアプリケ-ションの流れは、大きく分けて以下の3段階になります。 カテゴリ(クラス)定義 パターン学習 文書分類 単純ベイズ分類器(Naive Bayes classifier)ではクラス毎に単語の出現頻度を記憶して、その情報をもとに文書がそれぞれのクラスに属する確率を求めます。 SPAMフィルタなどでは「spam」と「nospam」のように2つのクラスだけで使用されることが多いです。多分。 パターン学習は、特定の文書(単語のセット)がどのクラスに所属するかを指定します。 これにより出現頻度のデータベース(コーパス)が更新されて、次回以降の分類精度を向上させることができます。 通常は、クラスを最初に設定して、以降は学習と分類を繰り返すような感じになると思います。 …ということで、クラスの定義から。 何故かNaiveBayesianStorageには、カ

  • 1