タグ

perlに関するxmmmのブックマーク (5)

  • perlを呼び出すモジュール - Doge log

    まあpythonからperlを呼び出せた方が何かと便利そうなので勉強がてら書き始めた。 my_perlの洗礼を受けながら適当にevalぐらいは動くとこまではできたかな。 そもそもperlが全然分かってないのでperlのソースも落として必要に応じて見ながら書いてる感じ。 mopemope / perlpy — Bitbucket power.pl use strict; use warnings; sub expo{ my ($a, $b) = @_; return $a ** $b; } >>>from perlpy import Perl >>>perl = Perl("power.pl") >>>perl.eval($a = 1) 1 >>>perl.call("expo", 2, 2) 4.0 1%ぐらいしかできてないけど。 エラー処理とか全然してないのでその辺はこれから。 あとSv

    perlを呼び出すモジュール - Doge log
  • Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法

    Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法 2009-02-26-1 [Programming][YahooHacks] Yahoo!デベロッパーネットワーク (YDN) のウェブ検索 API を用いて、入力キーのウェブ検索ヒット件数だけを取り出す簡単な方法について。 ウェブサービスを用いて自然言語処理っぽいことをやろうというときの基中の基。 使用している Web API の提供が終了となったため、現在動作しません。ご了承ください。 - Yahoo!デベロッパーネットワーク http://developer.yahoo.co.jp/ - Yahoo!デベロッパーネットワーク - 検索 - ウェブ検索 http://developer.yahoo.co.jp/webapi/search/websearch/v1/websearch.html Y!API に投げる

    Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法
  • pLSIを試してみた - のんびり読書日記

    これまでにK-means++とfuzzy c-meansを使用したクラスタリングを試してきましたが、今回はpLSI(probabilistic latent semantic indexing, 潜在的意味インデキシング)によるクラスタリングを試してみようと思います。 pLSIは確率・統計的な枠組みで次元縮約を行う枠組みで、なかなか精度がよいらしく色々な論文で見かけます。Google NewsのレコメンドでもpLSIを使用しており、MapReduceで処理を並列化させて高速に実行しているそうです(論文読んでないので間違っているかも)。また入力ベクトルをあらかじめ重み付けしておく必要がなく、文書であれば単語の頻度をそのまま入力として使用できるのもうれしいところです。 より詳しくは以下のWikipediaのエントリか、書籍をご参照下さい。(書籍は処理結果の表8.4が並びがグチャグチャになってる

    pLSIを試してみた - のんびり読書日記
  • Windows用テキストマイニングツール"termmi"

    はじめに "termmi"はWindows上のテキストファイルの専門用語を複数ファイル間で比較するシステムです。Windows専門用語抽出システム"termex"を用いても複数ファイル間の比較は行えますが、重要度の比較が行いにくいなどの問題がありました。テキストマイニング専用に作成した"termmi"を使うことにより複数ファイル間の重要度の数値比較を有意に行えるだけではなく、各文献の共通部分などさまざ まな比較結果を求めることができます。 機能と使い方 1.複数のテキストファイル(Shift-JIS)を入れたフォルダを、termmiのアイコンにドラッグ&ドロップします。 (和文の場合は「専門用語分析(和布舞)」アイコン、 英文の場合は「専門用語分析(英文)」アイコンになります) 2.termmiの各サブフォルダに処理結果が保存されます。内訳は次のとおりです。 (1)outputフォルダ 処

  • コサイン尺度(コサイン類似度)の計算 - Ceekz Logs (Move to y.ceek.jp)

    文書間の類似度を求める方法の一つとして、コサイン尺度が挙げられます。コサイン尺度とは、2つのベクトルのなす角度であり、文書をベクトル化することにより、文書間の類似度を求めることが出来ます。 sub cosine_similarity { my ($vector_1, $vector_2) = @_; my $inner_product = 0.0; map { if ($vector_2->{$_}) { $inner_product += $vector_1->{$_} * $vector_2->{$_}; } } keys %{$vector_1}; my $norm_1 = 0.0; map { $norm_1 += $_ ** 2 } values %{$vector_1}; $norm_1 = sqrt($norm_1); my $norm_2 = 0.0; map { $nor

  • 1