1997年、小中規模のメールアーカイブやWWWサーバ用の全文検索システムとして高林哲によって開発され、その簡便な使い勝手から1990年代末までに日本語圏における検索エンジンの代表格として普及した。2000年にバージョン2.0が公開されて以降は、Namazu Project名義による共同開発となっている。 転置索引方式のインデックスを採用。Perl言語で書かれたmknmzコマンドにより生成される。形態素解析には、KAKASI・ChaSen・MeCabの分かち書き機能を使用する。 フィルタ機能により、HTML以外にもOffice文書、PDF、TeX等様々な形式の文書を検索対象とすることができる。 作成されたインデックスを、C言語で書かれた“namazu”コマンドが動的に読み出して全文検索を行う。 検索フロントエンドには他に、C言語で書かれたCGIフロントエンド「namazu.cgi」、Perl
なんとなくシリーズ化してしまった、サイト内検索エンジンに関するコンテンツ。前回はナマズ Namazu の導入に踏み切ったという話を書きました。 今回は、そのナマズ Namazu を実際に使ってみての評価について書いていきたいと思います。ニュージーランドとはまったく関係ないコンピュータの話ですので、興味のある方、サイト内検索導入を考えているウェブマスターさんだけ、お読みください。 まず結論から言いますと、Namazu は「他の検索システムにはないメリットは絶大だが、分かち書き辞書の問題から、取りこぼしや精度に難があるため、100%の満足は得られていない」といったところです。そのため、「ニュージーランド・トランピング&温泉情報」のサイト内検索システムとしては、引き続き Namazu と msearch の併用という形で運用していきたいと思っています。 ■ Namazu のメリット・デメリット
Googleのようにキーワードを入力して自宅サーバーのWebサイト内を検索することができるようにする。 ここでは、あらかじめ作成しておくインデックスを使用して、高速に検索することができるNamazuでサイト内検索システムを構築する。 なお、検索対象のWebコンテンツは/var/www/html/centosに格納されているものとする。 ※NKFコマンドがインストールされていること [root@centos ~]# wget http://kakasi.namazu.org/stable/kakasi-2.3.6.tar.gz ← kakasiダウンロード ※最新版のURLはダウンロードページで確認すること [root@centos ~]# tar zxvf kakasi-2.3.6.tar.gz ← kakasi展開 [root@centos ~]# cd kakasi-2.3.6 ← k
<記載した内容は確認したつもりですが、間違いがあるかもしれません。アプリケーションのインストールやパソコンの設定などは自己責任でお願いします> Namazu(ナマズ)は高機能でフリーな日本語全文検索システムです。Namazu projectの皆さんが開発を進めています。LinuxなどUNIX系のOSのほか、Windowsにも移植されています。Web Serverと連携してCGIとして動作させれば、日本語で全文検索が可能な仕組みが構築できます。Search-S for namazuというWindows用のGUIなアプリケーションを利用すれば、LocalなPC内で多様なドキュメント(html、text、word、excel、power point、pdf、一太郎など)の全文検索が可能になります。 詳細はhttp://www.namazu.org/を参照してください。 Namazu2.0.13が
今回から,全文検索システムの「Kabayaki」を紹介します。Kabayakiは,日本語文書用に作られた全文検索システムです。オープンソースの全文検索エンジン「Namazu」に対してWebブラウザで各種設定を可能にするなど,使いやすく改良したものです。 全文検索は,文書の全情報が検索対象となります。ファイル名や見出し,文書中の特定の要素に限定しません。また,ファイル内の文字列検索が単一ファイルを対象にしているのに対し,全文検索は複数の文書が対象となります。操作は,検索キーワードを入力し「検索」ボタンを押すのみです。 Kabayakiは誰でも簡単に使えることを目指して開発されています。“Namazuをおいしくする”という意味からKabayakiと名付けられました。Linux対応のKabayaki-1.0.0が2001年6月に公開され,2003年6月にはWindows版のKabayakiも発表
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く