タグ

2007年10月17日のブックマーク (5件)

  • Dynamic Programming による類似文字列マッチの実装例

    Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを 素直に Perl で実装したみた。 さらにマッチ箇所取り出しロジックも実装してみた。 # DP はいわゆる「類似文字列検索(あいまい検索)」に使うと 便利なalgorithm。 実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。 単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、 転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二つの文字列 "

    Dynamic Programming による類似文字列マッチの実装例
  • E4X、連想配列とプロパティ、Object.evalメソッド - ockeghem(徳丸浩)の日記

    大垣さんのブログから 確かにかなり便利なのですが以下のコードでスクリプトが実行されることはほとんど知られていないでしょうね。 <script> 123[''+<_>ev</_>+<_>al</_>](''+<_>aler</_>+<_>t</_>+<_>(1)</_>); </script> このスクリプトの中には、興味深い要素がたくさん含まれていますが、説明もなく放り出されているので理解が難しいでしょうね。 E4Xについて まず目につくのは、JavaScript(ECMAScript)のスクリプト中にXML形式でオブジェクト・リテラルを記述できるE4X(ECMAScript for XML)という機能です(FireFox1.5以降で対応)。これは、例えば以下のように使います。 var order = <order> <name>Webアプリケーションのセキュリティ完全対策</name>

    E4X、連想配列とプロパティ、Object.evalメソッド - ockeghem(徳丸浩)の日記
  • テキストの類似度を測る- livedoor キーワード

    1車椅子ユーザー様「伊是名夏子さんが叩かれて唖然、無人駅を無...オレ的ゲーム速報@... 2車椅子ユーザーが苦言 「伊是名夏子さんが叩かれて唖然。無人...痛いニュース(ノ∀`... 3【悲報】小泉進次郎さんの野望、ワールドクラスだった……!!...NEWSまとめもりー|... 4【悲報】令和納豆、閉店へ不思議.net 5【こまち闘病記1】ある日こまちに異変が起きたまめきちまめこニー... 6マッチングアプリのプロ「男性は面倒でもがんばって彼女に連絡...はちま起稿 7メンヘラ女とデキ婚して10年経ったハムスター速報 8おまえらの墓場まで持って行く秘密哲学ニュースnwk 9大山悠輔(神).280317打点OPS.801なんじぇいスタジア... 102年間毎日4のエナジードリンクを飲み続けた英学生のヤバすぎ...【2ch】ニュー速ク... 11【愕然】ワイの勤めてる会社やばい・・・・・

    テキストの類似度を測る- livedoor キーワード
  • livedoor Developers Blog:String::Trigram でテキストの類似度を測る - livedoor Blog(ブログ)

    こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開発が開始されたともいう、分社化前の芸風の名残で、キーワードの検索結果にはユーザが自由に解説を書き込める Wikipedia 的スペースもついています。 で、この解説部分に、さまざまなサイトから文章をまる写ししちゃう人がとても多いのですね。 特に多いウィキペディア日語版からの剽窃を防止するために、livedoor キーワードでは以下のような対策を講じることにしました。 ウィキペディア日語版の解説

  • Mersenne Twister in JavaScript

     Mersenne Twister in JavaScript © 2006 Magicant / 0.2.4 (2005-12-23) 高性能な擬似乱数生成アルゴリズム「Mersenne Twister」の JavaScript による実装です。 (別途テストページあり) mt.js は原典のライセンスに反しない限り自由に使用していただいて構いません。 目次 mt.js の使い方 mt.js の API 仕様 Mersenne­Twister コンストラクタ set­Seed メソッド next メソッド next­Int メソッド 出力サンプル mt.js の使い方 実装ファイルは mt.js です。 このファイルは単独では実行しても意味がありません。 mt.js には Mersenne­Twister オブジェクトの定義が含まれており、これを他の