[B! 全文検索] Glnのブックマーク

Gln id:Gln

全文検索に関するGlnのブックマーク (13)

MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索〜InnoDB FTS編〜」
MySQL Casual Talks Vol.4 でのライトニングトークに利用した資料です。 MySQL-5.6.4より「InnoDB FTS」としてInnoDBで全文検索機能が加わりました。この全文検索機能を利用し、日本語の全文検索エンジンとしての可能性を探ります。ブログ記事はこちらです。 http://y-ken.hatena blog.com/entry/mysql-casual-talks-vol4-innodb-ftsRead less
Gln 2014/04/26
mysql

innodb

mroonga

全文検索

slide
リンク
論文コレクター必見！WindowsでPDFを全文検索する方法 | Chem-Station (ケムステ)
化学者のつぶやき論文コレクター必見！WindowsでPDFを全文検索する方法 2014/1/10 化学者のつぶやき, 実験・テクニック, 書籍・ソフト・Web 投稿者: cosine 電子論文が容易かつ大量に入手可能となった現在、その管理は最重要懸念事項です。ケムステでも各種文献管理法（Evernote、Mendeley、ReadCubeなど）をご紹介してきました。しかし、専用ソフトを使う方法には一つだけ欠点があります。「望みの論文を見つけ出すために、わざわざソフトを起動してフォーカスを移さなくてはならない」という一手間がかかるのです。・・・それぐらいやれよ！という声が聞こえてきそうですが、何度も積み重なるとこれはこれでめんどくさいんで・・・。筆者はWindowsユーザなのですが、問題の根源は「ダウンロードしたはずの論文を全文検索で見つけ出せないこと」にあると考えます。PDFの中
Gln 2014/01/13
全文検索

OS

Windows

pdf

IFilter
リンク
Rubyで簡単に全文検索エンジンが作れるGrnMiniを作った - ブログのおんがえし
続きを書きました。 RubyでただのArrayだと思って・・の続きです。正月中に整備してgem化しました。 GrnMini ongaeshi/grn_mini Groonga(Rroonga)を簡単に使えるようにラップしたものです。カラム指定不要でデータを追加することが出来ます。永続化、高度な検索クエリ、ソート、グループ化(ドリルダウン)、スニペット、ページネーションなどを簡単に使うことが出来ます。検索エンジンがすぐに作れます。インストール $ gem install grn_mini 基本的な使い方実体はRroongaの薄いラッパーですが難しいことを考えずに使えるよう工夫しています。 require 'grn_mini' array = GrnMini::Array.new("test.db") 初めてデータを追加する時にカラム種類を類推して作成します。追加するデータが文字列の
Gln 2014/01/07
Ruby

全文検索

programming
リンク
PDFの全文検索環境を整える4〜hyper estraierのcgiを使ってみる | Scimpr Blog
/etc/apache2/site-enabled/default を確認すると、ドキュメントルート /var/wwwcgi-binエイリアス /usr/lib/cgi-bin hyperestraierをインストールしてestseek.cgiなどをコピー sudo apt-get install hyperestraier sudo cp /usr/lib/estraier/estseek.cgi /usr/lib/cgi-bin/ sudo cp /usr/share/hyperestraier/locale/ja/*.* /usr/lib/cgi-bin/
Gln 2013/08/14
search

全文検索
リンク
Ubuntu に Hyper Estraier をインストールする | プラスター業務日記
を前提としてHyper Estraier のインストールと設定を行います。 STEP1．HyperEstraierのインストール $ apt-get install hyperestraier テキスト以外にもWord、Excel、PowerPointを検索対象とする場合には、wv、xlhtml、ppthtmlのインストールが必要です。 $ apt-get install wv xlhtml ppthtml STEP2．cgi-binの設定通常はdefaultでcgi-binに関しては設定済みですから設定は不要です。変更する場合に参考にしてください。 ScriptAlias /cgi-bin/ /usr/lib/cgi-bin/ <Directory "/usr/lib/cgi-bin/"> AllowOverride None Options +ExecCGI -MultiView
Gln 2013/08/14
ubuntu

search

全文検索
リンク
Tokyo (Cabinet|Tyrant|Dystopia)で作る全文検索の色々な方法まとめ - クリティカルスピード開発日誌
前提としてTokyoCabinet（若しくはTokyoTyrant)にテーブルDBがあり、その複数カラムにまたがって全文検索ができるようにしたい。例えばブログでいえばタイトルと本文と追記から全文検索をしたいとする。 Tokyoシリーズを使うということは平林幹雄氏の製品を信頼しているということなので、できればmade by mikioで検索できればいいなと思って調べてみたところ、想像以上に様々な方法があって迷った。有力そうな4案について勝手に長所と短所をまとめてみるので参考にして下さい。 Hyper Estraierを使う http://hyperestraier.sourceforge.net/index.ja.html Tokyo Tyrantにインデックスを張る mixi engineer blog Tokyo Tyrant+Lua拡張で転置インデックスを作成 mixi en
Gln 2013/08/14
全文検索

search
リンク
Tokyo Dystopiaの設計思想 - mixi engineer blog
夏本番に向けて海に行ける体作りに励まないといかんなーと思いつつも、ついついDSのスターフォックスで遊んでしまうmikioです。さて今回は、人知れずリリースされている検索エンジンTokyo Dystopiaの概要と設計思想について述べます。 Hyper Estraierとの違い Tokyo Dystopia（以下、TDと呼びます）は、新しい検索エンジンです。しかし、私が作ったもう一つの検索エンジンHyper Estraier（以下、HEと呼びます）の後継としては位置付けていません。 Hyper Estraierの製品コンセプトは、「検索システムの需要が生じる様々なシーンで手軽に導入できる」ことです。言い換えれば、「いわゆるシロウトの人でも、お高い商用システムを買えない個人や小組織でも、ちょっとの努力で自分の要求を満たすシステムを構築できる」ことです。そのために、様々なファイル形式に対応したテ
Gln 2013/08/14
search

mixi

全文検索
リンク
Tokyo Dystopia: a full-text search system
Overview Tokyo Dystopia is a full-text search system. You can search lots of records for some records including specified patterns. The characteristic of Tokyo Dystopia is the following. High performance of search High scalability of target documents Perfect recall ratio by character N-gram method Phrase matching, prefix matching, suffix matching, and token matching Multilingualism with Unicode La
Gln 2013/08/14
search

全文検索
リンク
Hyper Estraier: a full-text search system for communities
Overview Hyper Estraier is a full-text search system. You can search lots of documents for some documents including specified words. If you run a web site, it is useful as your own search engine for pages in your site. Also, it is useful as search utilities of mail boxes and file servers. The characteristic of Hyper Estraier is the following. High performance of search High scalability of target d
Gln 2013/08/14
全文検索
リンク
第5回　Rubyでサーバ要らずの高速全文検索！ - rroongaの紹介 | gihyo.jp
前回のMilkodeでの事例紹介では、Rubyでrroongaを使ってソースコード検索エンジンを実装している事例を紹介しました。Milkodeは全文検索エンジンを組み込むことにより、大量のファイルに対しても高速な検索を実現しています。rroongaを使った代表的なアプリケーションの1つです。プログラマにとってとても便利なアプリケーションなので、ぜひ使ってみてください。前回はユーザ視点からのrroongaの紹介でしたが、今回は違った角度から紹介します。rroongaの歴史、大事にしていることについて説明します。自分のアプリケーションで利用するプロダクトを検討するときに、プロダクトがどのような方向で作られているかを考慮していますか？自分のアプリケーションが大事にしたいことをそのプロダクトでも大事にしているなら、相性がよいかもしれません。さて、rroongaはあなたが大事にしたいことを大事
Gln 2013/06/04
ruby

全文検索
リンク
Algorithm - Suffix Array を JavaScript で再発明してみた : 404 Blog Not Found
2012年01月16日16:30 カテゴリアルゴリズム百選Lightweight Languages Algorithm - Suffix Array を JavaScript で再発明してみた WEB+DB 総集編 [Vol. 1〜60] もう10年以上前に某社のCTOだったころ、Suffix array(接尾辞配列)の解説を毎週の技術者ミーティングでしたら一名を除いて「ハァ?」状態だったことを思い出しつつ。 Suffix Arrayは何が画期的だったのか? 以下は、計算機科学者でなくても直感的に理解できると思います。ソートされていない通常のデータの中にあるサブデータ(キー)を検索しようとすると、データの大きさに比例した時間(O(n))がかかる。ソート済みのデータであれば、二分探索でデータの大きさの対数時間(O(logn))でキーを検索できる。さらにキーからIDを定数時間で作成でき
Gln 2012/03/18
全文検索

programming

javascript

algorithm
リンク
sary: a suffix array library and tools
What is sary? sary is a suffix array library and tools. It provides fast full-text search facilities for text files on the order of 10 to 100 MB using a data structure called a suffix array. It can also search specific fields in a text file by assigning index points to those fields. Table of Contents What's New Characteristics Brief Introduction to Suffix Array libsary Reference Manual Using the I
Gln 2009/06/18
suffix array

search

sary

全文検索
リンク
Sedue | PRODUCT | 株式会社 Preferred Infrastructure
Webサービスの裏側では様々なデータが蓄積されており、また企業内ではWord・Excel・メールなどの形でデータが日々増大しています。このデータを単にためておくだけではなく、有効活用するためにはデータからの「情報検索」が必須となります。この「情報検索」を実現するためには、様々なデータソース(DB, ファイルリポジトリ等)からの柔軟なデータの取り込みと、大規模なデータに対して高速な検索を行うための検索エンジンが、Sedue(セデュー)。様々な検索ニーズに対応する”統合検索プラットフォーム”です。蓄積された大規模データから、いかに素早く・簡単に情報を取り出せるかをテーマに製品化、テキストデータの全文検索はもちろん、レコメンデーション(関連文書検索・行動履歴推薦)のための機能も備えています。またデータの取り込みはリアルタイムに行う事が出来ます。これまでは異なる情報検索ニーズに対して、異な
Gln 2008/06/08
検索エンジン

search

software

全文検索

sedue
リンク
1