been6のブックマーク / 2015年1月29日

been6 id:been6

2015年1月29日のブックマーク (3件)

DSIRNLP#1で発表しました「TRIEにトライ！〜今日からはじめるTRIE入門〜」 - EchizenBlog-Zwei
昨日開催された「第1回データ構造と情報検索と言語処理勉強会(DSIRNLP)」に発表者として参加しました。主催者の@overlastさん、発表者の皆さん、ボランティアの皆さん、会場を提供してくださったミクシィさん、そして発表を聞いてくださった皆さん。どうもありがとうございました。また発表スライドについては@overlastさん、@uchumikさん、@machyさん、@nokunoさんにチェックして頂きました。特に@uchumikさん、@machyさんより頂いた意見のおかげでスライドの質が向上しました。ありがとうございました。発表スライド： (scribdのembedがうまくいかなかったので暫定的にリンクおいておきます) TRIEにトライ！〜今日からはじめるTRIE入門〜本記事では質疑応答でフォローしきれなかった部分を中心に、私の発表の補足的なものを書いて行きます。会のまとめ的な
been6 2015/01/29
trie

機械学習
リンク
#TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足
TokyoNLP 第8回にのこのこ参加。主催者の id:nokuno さん、発表者＆参加者のみなさん、そして会場を提供してくださった EC ナビさん改め VOYAGE GROUP さん＆ @ajiyoshi さん、お疲れ様でした＆ありがとうございました。今回は「∞-gram を使った短文言語判定」というネタを発表。「短文言語判定」って、要は「このツイートは何語？」ってこと。こちらが資料。 ∞-gram を使った短文言語判定 View more presentations from Shuyo Nakatani そして実装したプロトタイプ ldig (Language Detection with Infinity-Gram) とモデル(小)はこちらで公開。 https://github.com/shuyo/ldig 言語判定とは「文章が何語で書かれているか」を当てるタスクで、以前一度
been6 2015/01/29
自然言語処理

機械学習
リンク
極大部分文字列の復習 - nokunoの日記
極大部分文字列について復習しました．極大部分文字列を使った twitter 言語判定(中谷 NLP2012) - Mi manca qualche giovedi`?岡野原さんによる元論文はこちら．http://www-tsujii.is.s.u-tokyo.ac.jp/~hillbig/papers/nl187_okanohara.pdf 極大部分文字列の定義については，id:n_shuyoさんのTokyoNLPでの発表資料で，論文と同様の説明がサンプル付きでされています． #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - Mi manca qualche giovedi`?ここでは，部分文字列の間に，包含関係に基づく半順序関係を導入するこの半順序関係における極大元を極大部分文字列と定義するという定義の仕方をしていて非常にエレガントで分かりやすい…のです
been6 2015/01/29
文書分類
リンク
- 2015年1月30日
- 2015年1月29日
- 2015年1月28日