タグ

2009年4月3日のブックマーク (3件)

  • Database index - Wikipedia

    This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed. Find sources: "Database index" – news · newspapers · books · scholar · JSTOR (May 2024) (Learn how and when to remove this message) A database index is a data structure that improves the speed of data retrieval operati

  • Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ

    Luceneは、こちらのベンチマークなどを見る限り、Sennaなど他の全文検索エンジンに比べて相当遅いとされているようです。 上記ページのベンチマークではLucene 2.0が使われています。僕も数年前にLucene 2.0を使ったことがあって、それ以降はLuceneに触れていなかったんですが、最近のバージョンはパフォーマンスが大幅に改善されているそうなので、どれくらい速くなったのか、インデックス作成速度を比較してみました。 比較に使ったのはLucene 2.4.1(2009/03)とLucene 2.0.0(2006/05)です。以下の条件でインデックス作成時間を計測しました。 データ: 日語版Wikipediaのダンプから先頭20万記事 インデックス形式: 記事タイトル: Store.YES, Index.ANALYZED(元文字列+インデックス) 記事文: Store.COMPR

    Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ
  • 係り受け解析: まとめ - moratorium

    係り受け解析: まとめ 2007-06-12 (Tue) 10:24 IS TeXを頑張って覚えて最終レポートを書いたので、ここで晒す事にします。 MEによる日語係り受け解析 素性選択よりは色々な解析手法を試して精度向上したいなぁと思って作業していたのですが、限界が見えてきたので早めにまとめ上げました。 一緒に辻井研に行っているtmym氏がMEでLinear-time dependency analysis for Japanese [Sassano 04]の方式を試していて、面白い結果が出ているので期待。7500文/secって何ですか。 Similar Posts: 係り受け解析: 論文読み 係り受け解析: 実装 close(2) while select(2)ing Newer: 指きたっす Older: ESPer 2007 Comments:0 Comment Form N