タグ

ブックマーク / akoide.hatenablog.com (28)

  • JSAI参加してないメモ2 - KIWAM_KEN_DIARY

    リツイート時系列の 3 パラメータ混合対数正規分布モデルによる分析 Twitterのリツイートストリームの特徴を表現できるモデルを構築. リツイートは、早い段階で爆発的に拡散してあとは全く拡散しない、というものだけでなく、一度バーストして少し時間が空いて再びバーストする…というのもを存在する →ネットワークのクラスタ構造が影響しているのではないかと想定 ツイートを受け取ってから自分がリツイートするまでの時間遅れは対数正規分布に従うとする.(既存研究) それを、複数のバーストや分布の滑らかさを表現できるように拡張する.バーストの数だけの混合対数正規分布を考え、そこに時間遅れパラメータ(分布の平行移動)を加味したモデル(計3つのパラメータ) 時間遅れパラメータの推定にはプロファイル尤度なるものを使う.バーストの数はKleinbergのバースト検出法を利用.他のパラメータはEMアルゴリズムで推定

    JSAI参加してないメモ2 - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/06/07
  • JSAI参加してないメモ - KIWAM_KEN_DIARY

    学会には当分参加できそうにないし、論文読んで気分だけ味わう。 とりあえず気になるセッションの目に入った論文を読む ・ソーシャルメディアを用いた支持獲得に関する分析と提案 AKB総選挙を題材とし、Google+のアクションを使ってファンの傾向を分析 1.G+上でのファンの人数と選挙の順位には相関がある 2.多くのユーザは多数のAKBのメンバーのファンであり、順位が低いAKBメンバーのファンはその他大勢のメンバーのファンでもある 3.ファンユーザの類似度を使ってABKメンバー同士のつながりを可視化 ‐>Jaccard係数を使って閾値0.3以上でエッジを張る ‐>AKB同士、NMB同士で類似しやすい.さらにその中でコアノードがみられる 4.ファンの遷移を遷移ネットワークとして可視化 ‐>投稿間隔が一日以上離れた投稿に関するアクションに着目してファンの反応の順番をファンの遷移と考える ‐>遷移ネッ

    sucrose
    sucrose 2013/06/06
  • WSSITで発表してきた - KIWAM_KEN_DIARY

    ルスツリゾートで行われたWSSITにて「情報拡散モデルを用いた超媒介者検出法」と題して発表してきました. 発想や手法自体はシンプルで,あとは大規模データにどれくらい通用するかが今後の課題っぽい.個人的に今後期待できる内容だけど,自分の手から離れてしまうのが惜しいですね…. 他にも面白い発表がいくつかあって,せっかくなので質問してみたりした.やっぱり抱えている問題が似ていることが多くて,特にデータセットが不足しているところかなぁと思った.データに関してはいろいろ難しいところがあって,かゆいところに手が届かないような状態になることってよくあるなぁという感じ. あとは自分にも言えることだけど,ツールとか使っちゃうと結果は出てくるけどその裏でやっていることとかの理解がおろそかになるので,そういうところの勉強不足をきっちり補完していかないと今後不幸なことになりそう.

    WSSITで発表してきた - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/03/15
  • ちょっとメモ:Community QA Question Classification :Is the Asker Looking for Subjective Answers or Not? (ToD2011) - KIWAM_KEN_DIARY

    http://research.microsoft.com/en-us/people/tesakai/ipsj-tod0402002.pdf 自分が参加したWebDB Forum2010での論文賞論文の一つ.当時は発表を聞いても何もわからなかったので読んでみた. Yahoo!知恵袋や教えてGooのようなCQAサイトにおいて,”主観的”な回答を欲している質問か”客観的”な回答を欲しているかを分類するタスク. この分類の意義として,主観的な回答を欲している質問の場合には,回答者への回答を求めるし,客観的な回答を欲している質問の場合には,Web検索や類似質問の回答から回答を見つける方が,よりユーザが求めている回答に近いと考えられる. ○質問を学習するための定義 ●主観的な質問…質問者がより主観的な回答を期待しているもの 主観的回答とは ・共通知識や一般的な事実をベースとしたもの ・事実,定義,手

    ちょっとメモ:Community QA Question Classification :Is the Asker Looking for Subjective Answers or Not? (ToD2011) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2012/12/21
  • 東日本大震災ビックデータワークショップメモ - KIWAM_KEN_DIARY

    殴り書きですが… Twitterデータのタスク,可視化のタスクが多い さらに,デマ関係や首都圏の帰宅関係が多い ☆Twitterデータの利用 ・Twitterデータの意味的解析 イソジンのがん予防‐デマ ツイートに対する反応のツイートと抽出して解析 ツイートのバースト検出,システム化 ツイートの信憑(賛成意見と反対意見,それと根拠) ・ハッシュタグの利用傾向調査 情報の入手先の変更 ハッシュタグをまとめる(自由に作成できる) ハッシュタグがうまく使われていない ・MentionNWを作成し,その統計量調査,有力ユーザの検出 ・災害時質問応答システム 質問に対して,それを提供するツイートを提示 ・CHIDRI 災害支援システム データ管理と技術導入・公開 情報の瞬発力,デマの壁の発見 ・Twitterから震災時の行動経路を自動抽出 ・ジオタグを利用したメッシュごとのトピック検出 ・時系列解析

    東日本大震災ビックデータワークショップメモ - KIWAM_KEN_DIARY
    sucrose
    sucrose 2012/10/14
  • ざっと読んだ:measuring user influence in twitter the million follower fallacy ICWSM10 - KIWAM_KEN_DIARY

    http://snap.stanford.edu/class/cs224w-readings/cha10influence.pdf あらまし ソーシャルメディア上の有向リンクは,親密な友人関係から共通の興味,もしくは緊急ニュースに対する熱狂,有名人の噂話まで全てを表現する.各々のリンクは情報の流れを決定し,その上他人へのユーザの影響度を表す-それは社会学やバイラルマーケティングに必須の考えである.稿では,Twitterより収集した大規模データを利用し,影響力に関する3つの尺度,入次数,リツイート,そしてMentionのより深い比較について述べる.これらの尺度を基盤とし,トピックと時間を通じてユーザの影響度のダイナミクスについて調査する.我々はいくつかの興味深い観測をした.最初に,有名ユーザ(入次数の高いユーザ)は,リツイートやMentionに関してそれほど影響を必要としない.2つ目に,最

    ざっと読んだ:measuring user influence in twitter the million follower fallacy ICWSM10 - KIWAM_KEN_DIARY
    sucrose
    sucrose 2012/09/04
  • 読んだ:Information Credibility on Twitter(WWW2011) - KIWAM_KEN_DIARY

    http://www.ra.ethz.ch/cdstore/www2011/proceedings/p675.pdf あらまし 人気のあるマイクロブログサービスであるTwitterと通じて伝播するニュースの信頼性について分析する.既存研究により,Twitterで投稿されたほとんどのメッセージは真実であったが,このサービスはまた,間違った情報やうわさを,しばしば故意ではなく広げることに使われていることが示されている. 稿では,与えられたTweetの集合の信頼性を断定するための機械的な手法に着目する.とりわけ,”トレンドの”トピックに関係したマイクロブログの投稿を分析し,それらから抽出した特徴を基盤としてそれらを信頼しているものと信頼していないものにクラス分類する.我々は,ユーザの投稿,再投稿(RT)のふるまい,投稿の文章,外部ソースからの引用の中から特徴を用いる. 我々の手法を,Twitt

    読んだ:Information Credibility on Twitter(WWW2011) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2012/07/05
  • 読んだ:Analyzing Patterns of Information Cascades based on User's Influence and Posting Behaviors(TempWeb12) - KIWAM_KEN_DIARY

    http://www.tkl.iis.u-tokyo.ac.jp/top/modules/newdb/detail.php?id=1167 あらまし 昨今人々はTwitterやFacebookのようなソーシャルネットワークサイト上で有益な情報を共有することができる.情報は友人から友人へ繰り返し送られる,またはコピーされるとき,ネットワーク上で広がっていく.この現象は”情報カスケード”と呼ばれ,それが時に実世界で影響を持つことから長きにわたって研究されてきた.種々のソーシャルな活動は,ソーシャルネットワーク上でのカスケードの経路に違いがある傾向がある.この研究の我々の焦点は,種々のトピック内でのユーザの影響力と投稿のふるまいによるカスケードパターンの特徴づけである.カスケードパターンは広告活動の活発化のための戦略を熟考するための様々な組織に対して有用である.我々はカスケード比,ツイート比,ツ

    sucrose
    sucrose 2012/07/02