タグ

dartsに関するmogwaingのブックマーク (2)

  • Tiny Double-Array Library

    ダブル配列 ( Double-Array ) とは, トライ ( Trie ) のデータ構造の一つで, 「小さい辞書で高速な検索」が特長になります. トライを表現したデータ構造ですから, 「入力文字列の前方部分列と一致するキーの検索」が可能です. 使い方としては,フィルタリングや構文解析,形態素解析などがあります. ライブラリとしては,おそらく Darts が有名です. Darts: Double-ARay Trie System TinyDA は, Darts に影響されて作成したライブラリです. キーを整列して辞書に一括登録するようになっていて, レコードについては,型を特定せず,領域だけを確保するようになっています. そのため,辞書を作成した後でキーを追加することはできませんが, レコードを変更することは可能です. ただし,レコードを変更する場合は, 書き込む領域を誤ると辞書が破損し

  • Tx: Succinct Trie Data Structure

    English 概要 TxはコンパクトなTrieを構築するためのライブラリです.従来のTrieの実装(darts等)に比べ1/4〜1/10の作業領域量で辞書を保持することができ、数億〜十億キーワードなど大規模な辞書を扱うことが可能です.Trieは文字列からなるキー集合を処理するデータ構造で、キーが辞書に含まれているかのみではなく、キーのPrefixが含まれているかを高速に求めることができます.内部データ構造にはSuccinct Data StructureであるLevel-Order Unary Degree Sequence (LOUDS)を利用しています. ダウンロード Txはフリーソフトウェアです.BSD ライセンスに従ってソフトウェアを使用,再配布することができます. tx-0.12.tar.gz: HTTP Archives tx-0.11.tar.gz: HTTP tx

  • 1