タグ

2011年9月10日のブックマーク (2件)

  • CRF を使った Web 本文抽出 - 木曜不足

    とある確率でカオスでタイムマシンな勉強会を 7/30 にサイボウズにて開催。 お疲れ様でした&ありがとうございました>各位 会のテーマに合うかなあと心配しつつ、以前 TokyoNLP #1 にて発表させていただいた、CRF(Conditional Random Fields) を使った Web 文抽出ネタを焼き直し&プチバージョンアップして発表した。 その資料がこちら。 CRF を使った Web 文抽出 View more presentations from Shuyo Nakatani 最初は、元の資料そのまま持って行こうかな、と思っていたのだけど、結局結構それなりに改訂版に。 実装の方も少し更新してあって、最急降下法+FOBOS L1 に対応していたり、素性も約3倍に増えていたり。 データは……相変わらず少ないけど(苦笑)、訓練データとテストデータを分けて、定量的な結果を資料にま

    CRF を使った Web 本文抽出 - 木曜不足
  • 今話題の有料メルマガを読んでみた - FutureInsight.info

    前回のエントリーで軽くメルマガの話を書いたが、流行っているものはきちんと体験しておこうというタイプなので、早速まぐまぐでメルマガを購読してみた。 メルマガ選定 いろいろ見て、購読したのは以下の3つのメルマガ。 津田大介の「メディアの現場」 月額630円 高城未来研究所「Future Report」 月額840円 週刊isologue(イソログ) 月額840円 他にもいろいろあったが、こういう情報提供系のものというのは個人的には2つの軸があると思っている。一つは自分にとってキモチのいいことを提供してくれるもの、もう一つは他人にとってこれが有用な情報だろうというものを提供してくれるもの。自分にとって提供してくれるメディアは読んでて面白いがあまり広がりがない。有用な情報だろうというものを提供してくれるものは読んでてつまらないものもあるが、普段はあまり気にしないことを気づかせてくれたり、つまらなく