[B! perl] xmmmのブックマーク

xmmm id:xmmm

perlに関するxmmmのブックマーク (5)

perlを呼び出すモジュール - Doge log
まあpythonからperlを呼び出せた方が何かと便利そうなので勉強がてら書き始めた。 my_perlの洗礼を受けながら適当にevalぐらいは動くとこまではできたかな。そもそもperlが全然分かってないのでperlのソースも落として必要に応じて見ながら書いてる感じ。 mopemope / perlpy — Bitbucket power.pl use strict; use warnings; sub expo{ my ($a, $b) = @_; return $a ** $b; } >>>from perlpy import Perl >>>perl = Perl("power.pl") >>>perl.eval($a = 1) 1 >>>perl.call("expo", 2, 2) 4.0 1%ぐらいしかできてないけど。エラー処理とか全然してないのでその辺はこれから。あとSv
xmmm 2009/11/27
perl

python
リンク
Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法
Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法 2009-02-26-1 [Programming][YahooHacks] Yahoo!デベロッパーネットワーク (YDN) のウェブ検索 API を用いて、入力キーのウェブ検索ヒット件数だけを取り出す簡単な方法について。ウェブサービスを用いて自然言語処理っぽいことをやろうというときの基本中の基本。使用している Web API の提供が終了となったため、現在動作しません。ご了承ください。 - Yahoo!デベロッパーネットワーク http://developer.yahoo.co.jp/ - Yahoo!デベロッパーネットワーク - 検索 - ウェブ検索 http://developer.yahoo.co.jp/webapi/search/websearch/v1/websearch.html Y!API に投げる
xmmm 2009/11/27
perl

yahooapi

nlp
リンク
pLSIを試してみた - のんびり読書日記
これまでにK-means++とfuzzy c-meansを使用したクラスタリングを試してきましたが、今回はpLSI(probabilistic latent semantic indexing, 潜在的意味インデキシング)によるクラスタリングを試してみようと思います。 pLSIは確率・統計的な枠組みで次元縮約を行う枠組みで、なかなか精度がよいらしく色々な論文で見かけます。Google NewsのレコメンドでもpLSIを使用しており、MapReduceで処理を並列化させて高速に実行しているそうです(論文読んでないので間違っているかも)。また入力ベクトルをあらかじめ重み付けしておく必要がなく、文書であれば単語の頻度をそのまま入力として使用できるのもうれしいところです。より詳しくは以下のWikipediaのエントリか、書籍をご参照下さい。(書籍は処理結果の表8.4が並びがグチャグチャになってる
xmmm 2009/11/12
クラスタリング

perl
リンク
Windows用テキストマイニングツール"termmi"
はじめに "termmi"はWindows上のテキストファイルの専門用語を複数ファイル間で比較するシステムです。Windows専門用語抽出システム"termex"を用いても複数ファイル間の比較は行えますが、重要度の比較が行いにくいなどの問題がありました。テキストマイニング専用に作成した"termmi"を使うことにより複数ファイル間の重要度の数値比較を有意に行えるだけではなく、各文献の共通部分などさまざまな比較結果を求めることができます。機能と使い方１．複数のテキストファイル(Shift-JIS)を入れたフォルダを、termmiのアイコンにドラッグ＆ドロップします。（和文の場合は「専門用語分析（和布舞）」アイコン、英文の場合は「専門用語分析（英文）」アイコンになります）２．termmiの各サブフォルダに処理結果が保存されます。内訳は次のとおりです。（１）outputフォルダ処
xmmm 2009/09/14
perl

textmining

nlp
リンク
コサイン尺度（コサイン類似度）の計算 - Ceekz Logs (Move to y.ceek.jp)
文書間の類似度を求める方法の一つとして、コサイン尺度が挙げられます。コサイン尺度とは、2つのベクトルのなす角度であり、文書をベクトル化することにより、文書間の類似度を求めることが出来ます。 sub cosine_similarity { my ($vector_1, $vector_2) = @_; my $inner_product = 0.0; map { if ($vector_2->{$_}) { $inner_product += $vector_1->{$_} * $vector_2->{$_}; } } keys %{$vector_1}; my $norm_1 = 0.0; map { $norm_1 += $_ ** 2 } values %{$vector_1}; $norm_1 = sqrt($norm_1); my $norm_2 = 0.0; map { $nor
xmmm 2009/09/14
algorithm

perl
リンク
1