タグ

2018年8月22日のブックマーク (4件)

  • 情報系修士にもわかるダブル配列 - アスペ日記

    最近話題の「日本語入力を支える技術」を途中まで読んだ。 3章がものすごく気合いが入っている。 trie(トライ)というデータ構造の2つの実装、「ダブル配列」と「LOUDS」について詳しく説明がされている。 ダブル配列については、ぼくは以前論文を読んで勉強しようとしたのだが、その時は難しくてあきらめた覚えがある。しかし、このの説明を読むことで理解ができた。 ありがたい。 感銘を受けたので、このを教材に友達と2人勉強会をした。 この2人勉強会というのは、ぼくが復習を兼ねて友達に教えるというのがだいたいのスタイル。 しかし、いざやってみるといろいろと難しい。 次のようなところでひっかかるようだ。 例のサイズが小さく、イメージを喚起するのが難しい。 最初の図のノード番号と、最終的なダブル配列上の位置が異なるため、混乱する。 単語終端について言及がないので、どのノードが単語を表しているかがわから

    情報系修士にもわかるダブル配列 - アスペ日記
  • テキスト処理に使われるTrie(トライ木)とLOUDSに関する概略 | ALTUS-FIVE

    Trie(トライ木)を用いた検索は高速・省メモリTrie(= Retrieval tree, 検索木)はテキスト処理において必需品と言えるデータ構造です。辞書検索、日本語入力、サジェストの実装や、形態素解析に使われる辞書(形態素辞書)が主な用途と言えるでしょうか。Pythonの自然言語処理パッケージNLTK(Natural Language Tool Kit)でも、形態素解析にトライ木を用いています。 参考:http://www.nltk.org/book-jp/ch12.html Trie(トライ木)とは? 例として、辞書として使われているトライ木の「A」から始まる単語を格納した部分を図示してみました。このように、探索木の各エッジに文字を割り当て、根ノードから葉ノードに至る経路(path)上の文字を拾っていった時の文字列によって辞書を表現します。この辞書には、「AGE」「AGILE」「A

    テキスト処理に使われるTrie(トライ木)とLOUDSに関する概略 | ALTUS-FIVE
  • PostgreSQL indexing in Rails

    The things you need to know about PostgreSQL indexes to keep your Rails applications snappy. The purpose of indexes is to make access to data faster. Most of the time an index will make your queries faster but the trade off is that for each index you have your data insertion will become slower. That’s because when you insert data with an index it must write data to two different places. PostgreSQL

  • 英語・than が付かない比較級の文 : なるほどの素

    2月17 英語・than が付かない比較級の文 カテゴリ:英語 比較級の文で、 My brother is taller than I. Taro can swim better than you. のように than を含んだ文に慣れていると、 That mountain is higher. You should run faster. のような than を含まない文がなんだか不完全に思えてくるかも 知れませんが、これも立派な比較級の文です。 than 以下は比べるもの(物・人)を明確にするために付いていますが、 ●前後関係から比べるものがはっきりしている ●比べるものを明示する必要がない 場合は、 than 以下はなくてもかまわないのです。 Look at those two flowers. I like the red one better. 「私は赤い方が好きです。」 (赤色