[B! テキストマイニング] takuma510のブックマーク

takuma510 id:takuma510

テキストマイニングに関するtakuma510のブックマーク (3)

デマをデマと見抜けない人はTwitterを使うのは難しい - kisa12012の日記
Twitterにおけるデマ検出手法を論じた研究が，ついにEM NLP2011に出てきたので紹介します．論文：Rumor has it: Identifying Misinformation in Microblogs[Qazvinian et al., 2011] Twitter上のデマに関する興味深い統計情報も幾つか含まれているので，興味のある方は一読されると良いかと思います．概要噂と噂に関連するツイートを検出すると同時に，その噂の信頼度を推定様々な特徴量を用いて実験ツイートの文面を使って分類器を作るだけで，高い精度が実現可能！ただし，アノテートされたツイートを教師データとして使用背景マイクロブログ上で噂は急速に広まるデマや誤情報は，企業にとって大きな障害となりうるので自動で特定したいこの研究では，以下の手順でデマや誤情報を検出する特定の噂に関して言及しているツイート
takuma510 2011/08/05
テキストマイニング

nlp
リンク
第3回さくさくテキストマイニング勉強会に参加しました #sakuTextMining - nokunoの日記
というわけで参加してきました。会場は数理システムさんです。第3回さくさくテキストマイニング勉強会 : ATND 入門セッション（AntiBayesian）第三回さくさくテキストマイニング勉強会　入門セッション View more presentations from AntiBayesian 単語重要度入門〜テキストをダイエットさせよう〜（ toilet_lunch ） TF*IDFの話えっ私のテキストマイニング力低すぎ！？例：大量のアンケートの自由回答文から重要な単語を抜き出す例：エビオス嬢についての文章 TF*IDFとは TF（単語の頻度） * IDF（単語が含まれる文書割合の逆数（の対数））直感的ば解釈：ある文書でよく使われていて、他の文書ではあまり使われていない単語は、その文書をよく表しているなんで対数取るんだっけ・・・ IDFの影響が大きすぎるので小さくしたい→対数
takuma510 2011/06/04
コーパスの集め方とか

nlp

テキストマイニング
リンク
第1回にこにこテキストマイニング勉強会に参加しました #nicotextmining - nokunoの日記
というわけで参加してきました。第1回にこにこテキストマイニング勉強会 : ATND 目的テキストマイニングについての学習のスタートアップテキストマイニング技術に関して気軽に参加・議論することができる場の提供概要テキストマイニングとは、例えば製品の評判をweb上のテキストから抽出したり、大量のアンケートテキストを分析するために用いられる技術であり、特にマーケティングの場で多くの利用例があります。この勉強会ではそうしたテキストマイニングを題材とし、用いられている要素技術とそれに関わる課題の議論、またテキストマイニングを実務に活かす方法について考えていきます。会場のオラクルセミナールームでは隣でPythonハッカソンが行われており、そちらにも知り合いがいたり飲み物が無料だったりして居心地の良い場所が形成されていました（入るまでが大変でしたが‥）。Python Hack-a-thon 201
takuma510 2011/02/20
nlp

テキストマイニング
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx