タグ

ブックマーク / www.mwsoft.jp (2)

  • SolrにWikipediaのデータを入れて遊ぶ

    概要 全文検索エンジンのSolrを使って、Wikipedia(日語版)の記事を検索する機能をさらっと作ってみる。面倒なことはすっ飛ばして、できるだけ少ない手数を選択。あと、ソースコードはJava。 注意事項として、Solrはけっこうメモリう。特にoptimize時とか、大掛かりなソート時とか。 メモリが少ないマシンでは使うと不自由するので避けた方が良いかもしれない。とりあえず手元の4G積んだマシンでは快適に動いている。 @CretedDate 2011/09/04 @Env Solr3.5.0 / lucene-gosen1.2.1 @UpdateDate 2012/02/21 Solr3.5.0に変更したりクエリの誤りを直したり Solrの導入 まずSolrをダウンロードして解凍する。 ここからダウンロード http://lucene.apache.org/solr/#getstar

  • Javascriptでレーベンシュタイン距離の実演

    Javascriptでレーベンシュタイン距離の実演 レーベンシュタイン距離は、2つの文字列の間にどの程度の差があるかを算出します。 具体的には、2つの文字を同一にするには、挿入・置換・削除を何回行えば良いか最小回数を算出します。 ※IE8、FF3.6、Chrome4で動作を確認しています。IE7以下では動作しません。 ※このスクリプトはイメージです。ほとんどテストしてないのでバグってたらすいません。 サンプル テキストボックスに文字列を入力してボタンを押すと、2つの文字列の距離が出力されます。

  • 1