タグ

2015年1月29日のブックマーク (3件)

  • DSIRNLP#1で発表しました「TRIEにトライ!〜今日からはじめるTRIE入門〜」 - EchizenBlog-Zwei

    昨日開催された「第1回 データ構造と情報検索と言語処理勉強会(DSIRNLP)」に発表者として参加しました。主催者の@overlastさん、発表者の皆さん、ボランティアの皆さん、会場を提供してくださったミクシィさん、そして発表を聞いてくださった皆さん。どうもありがとうございました。 また発表スライドについては@overlastさん、@uchumikさん、@machyさん、@nokunoさんにチェックして頂きました。特に@uchumikさん、@machyさんより頂いた意見のおかげでスライドの質が向上しました。ありがとうございました。 発表スライド: (scribdのembedがうまくいかなかったので暫定的にリンクおいておきます) TRIEにトライ!〜今日からはじめるTRIE入門〜 記事では質疑応答でフォローしきれなかった部分を中心に、私の発表の補足的なものを書いて行きます。 会のまとめ的な

    DSIRNLP#1で発表しました「TRIEにトライ!〜今日からはじめるTRIE入門〜」 - EchizenBlog-Zwei
  • #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足

    TokyoNLP 第8回に のこのこ参加。主催者の id:nokuno さん、発表者&参加者のみなさん、そして会場を提供してくださった EC ナビさん改め VOYAGE GROUP さん& @ajiyoshi さん、お疲れ様でした&ありがとうございました。 今回は「∞-gram を使った短文言語判定」というネタを発表。「短文言語判定」って、要は「このツイートは何語?」ってこと。 こちらが資料。 ∞-gram を使った短文言語判定 View more presentations from Shuyo Nakatani そして実装したプロトタイプ ldig (Language Detection with Infinity-Gram) とモデル(小)はこちらで公開。 https://github.com/shuyo/ldig 言語判定とは「文章が何語で書かれているか」を当てるタスクで、以前一度

    #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足
  • 極大部分文字列の復習 - nokunoの日記

    極大部分文字列について復習しました.極大部分文字列を使った twitter 言語判定(中谷 NLP2012) - Mi manca qualche giovedi`?岡野原さんによる元論文はこちら.http://www-tsujii.is.s.u-tokyo.ac.jp/~hillbig/papers/nl187_okanohara.pdf 極大部分文字列の定義については,id:n_shuyoさんのTokyoNLPでの発表資料で,論文と同様の説明がサンプル付きでされています. #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - Mi manca qualche giovedi`?ここでは, 部分文字列の間に,包含関係に基づく半順序関係を導入する この半順序関係における極大元を極大部分文字列と定義するという定義の仕方をしていて非常にエレガントで分かりやすい…のです