商品の説明内容紹介 Apache Solrとは,オープンソースの検索エンジンです.Apache LuceneというJavaの全文検索システムをベースに豊富な拡張性をもたせ,多くの開発者が利用できるように作られました.検索というと,Googleのシステムを使っている企業Webページが多... 続きを読む
SimStringは,類似文字列検索のための高速かつシンプルなライブラリです. 類似文字列検索とは,文字列集合(データベース)の中から,クエリ文字列との類似度が閾値以上のものを,見つけ出す操作です. クエリ文字列と完全に一致しなくても,データベース中の... 続きを読む
Emacsの検索機能を使いこなす(菅原泰樹) 「Emacsのトラノマキ」 連載第一回 「Emacsの検索機能を使いこなす」 ■■■100年のエディタの世界へようこそ(脚注) 今月からEmacsの話を中心にした連載を始めることになりました.本連載は,Emacsを使って最高のエンジ... 続きを読む
周辺にも興味のあるキーワードがあれば語尾に「?」をつけてください そのキーワードに近い意味合いの語まで含めた検索結果が得られます 続きを読む
_ [コンピュータ] Bayesian Sets何はともあれ一番目立つところにリンクをば。 ここのところちょっと時間が取れたので、以前から気になっていたBayesian Setsを実装してみました。Bayesian Setsは、ある単語を入力すると、それと関係が深い単語を推測して返して... 続きを読む
The Similarity Search Wiki The purpose of this wiki is to collect links, people, ideas, keywords, papers, slides, code and data sets on nearest neighbors in a single place. [edit] Definition To preprocess a database of N objects so that given... 続きを読む
Homepage of Yury LifshitsThe Homepage of Nearest Neighbors and Similarity Search Maintained by Yury Lifshits To preprocess a database of N objects so that given a query object, one can effectively determine its nearest neighbors in database T... 続きを読む
ICML/UAI/COLTのaccepted paperが出揃い、ざーっと面白そうなのを片っ端から読んでみました。 ICMLの読んでみた、読んでみたいリスト そのうちピックアップします。 ICMLは強化学習系が多くなっているなぁという気もしたのですがそうでもないかな。 ついでに、... 続きを読む
社内NEET宣言文学部出身なのにIT企業で研究開発をすることになった社員のブログです。エンジニア/ニートレポート・実験 続きを読む
何か論文読んで,それについて発表するという授業があるのですが,そこでSimilarity Joinについて調べたのでここにメモします.●Similarity Joinって何?すごく大雑把に言うと,類似しているものを結合すること.そのまんまですね.例えば,上図のように4つの... 続きを読む