タグ

2010年12月16日のブックマーク (3件)

  • オープンソースのTrieライブラリまとめ - nokunoの日記

    最近、趣味で開発しているStaKKのためにTrieライブラリを書いているのですが、参考にするためオープンソースのTrieライブラリについて調べました。簡潔データ構造を用いたものが中心です。 @hillbig氏によるもの tx LOUDSによる圧縮でメモリ使用量を削減したTrieライブラリ。 関連記事:Tx: Succinct Trie Data Structure Engineering the LOUDS Succinct Tree Representation - 射撃しつつ前転ux txの改良版。tailの圧縮によりtxの1/2くらいのサイズになるらしい。要チェック。 関連記事:ux... - ny23の日記id:s-yata 氏によるもの taiju LOUDSを含む簡潔データ構造を用いた大規模Trieライブラリ。sumire-triesインメモリの簡潔データ構造を実装した大規模T

    mamoruk
    mamoruk 2010/12/16
    おお、知らないのがいっぱい。。。参考になります〜
  • NLP関係のリソースまとめ - nokunoの日記

    先日オープンソースのtrieライブラリについてまとめましたが、それ以外にも家での開発に使えるリソースが増えてきました。 コーパス WikipediaコーパスTwitterコーパスBaiduコーパスWebコーパスWikipedia対訳コーパスオープンソース対訳コーパスMS-IMEコーパス 辞書 WikipediaタイトルはてなキーワードIPAdicUnidicalt-cannadicSKK評判辞書

    mamoruk
    mamoruk 2010/12/16
    まとめてあって素敵。でもライセンスはそれぞれけっこう違うので、自分で使う場合はちゃんと調べないとだめですよ〜。研究教育目的以外不可、というのはちょっと使いにくいかも。
  • 経済 | 毎日新聞

    バブル期に付けた最高値を約34年ぶりに超えてようやく振り出しに戻った日の株式市場。日企業に対する評価や期待が高まる一方、海外や日の経済の先行きには不安材料も見える。早くも「4万円超え」の声が上がる現在の株高に死角はないのか。 「今の株高は自然な流れ。市場では日企業の価値を見直す動きが始まっ

    経済 | 毎日新聞
    mamoruk
    mamoruk 2010/12/16
    確かにこういうサービスにも機械学習・データマイニング使えますな〜