タグ

ブックマーク / akoide.hatenablog.com (28)

  • 適当に読んだ:Dynamics of News Events and Social Media Reaction(KDD2014) - KIWAM_KEN_DIARY

    論文を上手に読むこつが知りたい。 Dynamics of News Events and Social Media Reaction アブスト あるトピックに関する、ニュース投稿と、それに伴うソーシャル上の意見の変化のダイナミクスについての研究。ニュースとソーシャルメディアの振る舞いを、イベントの重要性とメディアのresponce関数の間のコンボリューションとしてモデル化する。それによって、各トピックに対するニュースイベントを抽出し、そしてそれと感情的な意見の時間変化とを相互に関係を持たせることで、イベントのダイナミクスと意見の変化のつながりを明らかにする事が出来る。 イントロ 特徴として、イベントの重要性とダイナミクスを理解するために、関連するニュース記事の投稿数だけでなく、ソーシャルメディアの反応を考慮に入れる事が挙げられる。 また、イベントに対するニュース投稿(もしくはユーザーの興味

    適当に読んだ:Dynamics of News Events and Social Media Reaction(KDD2014) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2015/05/13
    s/responce/response/
  • 読んだ:Cross-Device Search(CIKM2014) - KIWAM_KEN_DIARY

    GWは風邪を引いてほぼ寝ていました。●畜なのか平日は風邪をひきません。 http://research.microsoft.com/en-us/um/people/ryenw/papers/montanezcikm2014.pdf デバイスを跨いだ検索の理解(トピックなど)と、デバイス遷移予測モデルの構築。 デバイスの遷移が予測できれば、例えば、PCからスマホにデバイスを変更した検索した人に対して、スマホ向けの短い記事を優先的に提示するといったデバイスに特化した試作を打つ事が出来る。 ・デバイスとして、PC,tablet,smart phone,game consoleの4つを選択。 -データセットと基的な特徴 コマース系検索エンジンから数ヶ月分の検索クエリを取得。 ・クエリベースの統計量 クエリ数がおよそ2億で、複数デバイスを利用しているユーザーが検索したクエリ数はおよそ16%だった。

    読んだ:Cross-Device Search(CIKM2014) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2015/05/06
  • 読んだ:Reduce and Aggregate: Similarity Ranking in Multi-Categorical Bipartite Graphs(WWW2014) - KIWAM_KEN_DIARY

    数式追えてないのでざっくり。数式よまないとこの論文はいかんけど。 Reduce and Aggregate: Similarity Ranking in Multi-Categorical Bipartite Graphs 大規模な複数カテゴリからなる二部グラフから、ユーザの類似性をランキングする問題を扱う。 ここで言う二部グラフは、ユーザとアイテム(どちらも複数のカテゴリに分割される) から構成される。 二つの挑戦 1.2部グラフは巨大でいびつ(数百万の広告にたいして数億のクエリが結びつくような)である 2.可能な限りのカテゴリの組み合わせを、結果ごとに再計算するのを防ぐ グラフで類似度を測る際に一般的に利用されるCommonNeighborやPersonalizedPageRank(PPR)を使う。 ●計算方法 今回のフレームワークはreduceオペレーターとaggregationオペ

    読んだ:Reduce and Aggregate: Similarity Ranking in Multi-Categorical Bipartite Graphs(WWW2014) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2014/06/30
  • JSAI2014行けなかったしいくつか読んでみる-Twitter- - KIWAM_KEN_DIARY

    足を痛めたので会社行きたくない Twitter における候補者の情報拡散に着目した 国政選挙当選者予測 Twitterデータを利用して国政選挙の当選者を予測する。既存の手法で使われていたフォロワー数等の指標に加え、情報拡散の規模、多様度、忠誠度の3つ新たな指標を提案。 まず情報拡散支援者を定義。候補者のツイートをRetweetしやすいかつそれなりにフォロワー数が多いユーザ。 情報拡散規模・・・情報を受け取るユーザの期待値 多様度・・・情報拡散の際、情報支援者のなかで、相互関係にないユーザにどのくらい情報が伝わったかを加味する。支援者同士が同じコミュニティにいない方が多くの人に情報が伝わりやすいという仮定。 忠誠度・・・支援者がRTする全候補者のツイートのなかで、任意の候補者をRTする割合を考慮した指標。 分類モデルとしては、Random Forestを使用。 比較として、既存手法(候補者フ

    JSAI2014行けなかったしいくつか読んでみる-Twitter- - KIWAM_KEN_DIARY
    sucrose
    sucrose 2014/06/15
  • JSAI2014行けなかったしいくつか読んでみる-複雑ネットワーク- - KIWAM_KEN_DIARY

    昨日は読んでいたら3時回っていて、駅まで全力ダッシュするはめになったので平日は自重気味で行く。 有向ネットワークの構造が情報拡散に与える影響の分析 ネットワーク構造と情報拡散の関係を明らかにするため、ネットワーク関する13個の指標を用意。ある一つの指標だけを変化させ、そのネットワークで情報拡散シミュレーションを行う。指標の増減と情報が伝わったノード数(以下期待影響度)との相関を見る事で、情報拡散と関連の強い指標を検出する。 その結果、ノード内次数相関と期待影響度に極めて強い相関がある事がわかった。ノード内次数相関が高いということは、任意のノードの入次数と出次数がほとんど同じ数だけあるという事になる。 そのほか、到達可能率(任意の2つのノードの組み合わせに対してリンクをたどって到達できる比率)や次数相関に関連した指標が相関が高く出ている。 これらの結果を考慮したネットワークを作成してみると

    sucrose
    sucrose 2014/06/15
  • JSAI2014行けなかったしいくつか読んでみる-その1- - KIWAM_KEN_DIARY

    検索エンジン ソーシャルメディアの情報統合によるエキスパート検索エンジンに関する研究 目的の知識を有したエキスパートを検索する「エキスパート検索問題」に対し、ウェブ上のデータソースを用いた検索基板Social Expert Search Engineを提案。 Web上のデータソースから情報を取得し、その情報を統一されたメタ情報に変換してエキスパート知識データベースに格納。この情報利用してエキスパートの専門性をスコアリングして、ユーザの要求に合うエキスパートを提供する。 このシステムを応用してポートフォリオ生成エンジンを作成。データソースとしてGithubGoogle Playを利用した。 被験者9人の評価により、データソースの不足によるスキルの不一致や提供UIに不満が出た。 ※素朴にLinkedInじゃダメなのかなぁと思う部分もあった。それこそLinkedInに成ってしまうが、人間関係を

    JSAI2014行けなかったしいくつか読んでみる-その1- - KIWAM_KEN_DIARY
    sucrose
    sucrose 2014/06/15
  • JSAI2014行けないし、せめて個人的に面白そうなタイトルリストでも作るか - KIWAM_KEN_DIARY

    タイトルだけで読んでみたいものをまとめておく。少しずつ読んで行く。 検索エンジン ソーシャルメディアの情報統合によるエキスパート検索エンジンに関する研究 マイクロブログ Twitter における候補者の情報拡散に着目した 国政選挙当選者予測 マイクロブログへの投稿に基づく政治家の立場推定 Twitter における集団的感性のモデリング データ研磨手法を用いた Twitter ユーザの関係構造変化の検出 SNS の共有行動を用いたユーザーの興味のモデル化に対する考察 -2013 年参議院議員選挙を題材として- プライバシー保護データマイニング 医療データ利用におけるプライバシ保護の課題とその解決策の提案 匿名化の実社会での利用に向けての技術課題 複雑ネットワーク 有向ネットワークの構造が情報拡散に与える影響の分析 単語のコミュニティ性に基づいた専門用語の抽出 分散表現を用いたコミュニティにお

    JSAI2014行けないし、せめて個人的に面白そうなタイトルリストでも作るか - KIWAM_KEN_DIARY
    sucrose
    sucrose 2014/06/15
  • 読んだ:Modeling and Predicting the Growth and Death of Membership-based Websites(WWW2014) - KIWAM_KEN_DIARY

    Modeling and Predicting the Growth and Death of Membership-based Websites FacebookやHuffington Postのようなインターネットのスタートアップが成功する要因を突き止めるために、成功、失敗の成功メカニズムを解明する。22のメンバーシップベースのwebサイトのデイリーのユーザ数(DAU)を6年間にわたって収集。 サイトの成長・衰退パラメータと、成長法(口コミ・メディア)についてのパラメータを用意してモデル作成。 ※定義(tは任意の時刻) ...アクティブユーザ(DAU) ...ノンアクティブユーザ ...メンバーでないユーザ ...WebSiteのキャパシティ ...アクティブメンバーの影響力パラメータ。ノンアクティブユーザをアクティブへ遷移させる率。 ...衰退率。アクティブユーザがアクティブでなくな

    読んだ:Modeling and Predicting the Growth and Death of Membership-based Websites(WWW2014) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2014/04/09
  • 読んだ:Learning Social Network Embeddings for Predicting Information Diffusion(WSDM2014) - KIWAM_KEN_DIARY

    情報拡散の分析・モデル化は既知のグラフや近接的な構造の上で扱われる。 しかし、複数のアクターとメディアの相互関係による潜在的な現象は複雑であり、 既存のモデルや限られた仮説だけでは説明できない。 我々は、この問題に対する新たなアプローチとして、連続的な空間上に 観測された時間的なダイナミクスをマッピングする。 拡散カスケードに関係するノードは潜在的に表現された空間に投影される。 これは、投影空間内ノードの近接性をカスケード内の感染時間の近接性に 反映した拡散カーネルを学習することになる。 提案手法はいくつかのこれまでにない特徴を持っていて、 ・パラメータはカスケードサンプルから直接学習し、それまでの拡散構造には従わない ・等式が投影空間内に閉じた形で表されることから、離散的なモデルに比べて予測に対する推定が早い 手法の拡散予測の精度並びに推定スピードが既存のものより優れていることを示す。

    sucrose
    sucrose 2014/03/14
  • 読んだ:Search Engine Click Spam Detection Based on Bipartite Graph Propagation(WSDM2014) - KIWAM_KEN_DIARY

    殴り書いていくスタイル。 Search Engine Click Spam Detection Based on Bipartite Graph Propagation クリックの情報は文書のランキングにおいて重要な要素である。 結果、いくつかのWebサイトは彼らのページへの不正なクリックの増加に よって高ランクを得る。これはクリックスパムと呼ばれている。 不正なクリックの特徴に関する分析をベースに、 1.ユーザのセッションを行動だけでなく、セッションの目的とセッション間の 間隔もまた考慮に入れた3つの連鎖によってモデリングする 2.より不正を働いているセッションを発見するため、不正を働くユーザに有効になる ように2部グラフの伝搬アルゴリズムを使用する 3.高precision,recallに達するような不正なセッションパターンを得るために、 パターンセッションの2部グラフ伝搬アルゴリズム

    sucrose
    sucrose 2014/03/07
  • メモ:Visualizing Brand Associations from Web Community Photos(WSDM2014) - KIWAM_KEN_DIARY

    Visualizing Brand Associations from Web Community Photos 見た目が大変良くて読み始めたけど途中で完全に沈没した。 アウトプットはものすごくビジネス受けしそうな感じはある。 1st autherがdisneyの人 ・ブランドアソシエーション...マーケティングにおける主要な発想のひとつで、 ブランドに対する消費者のtop-of-mindな属性や感性を表現すること。 ・top-of-mind..."〜と言えば?"と訪ねたときにまず最初に思い浮かぶもの 伝統的に、ブランドアソシエーションは消費者の反応のテキストデータや、 オンライン上の会話ログを分析することで行われていた。 稿では、オンライン上の大規模な写真群を活用することを提案する。 技術的なステップ 1)ブランドと関連づける核となる抽出・可視化の発想 2)イメージ内でブランドの領域を

    メモ:Visualizing Brand Associations from Web Community Photos(WSDM2014) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2014/03/07
  • 読んだ:Unsupervised Social Network Spam Detection(CIKM2013) - KIWAM_KEN_DIARY

    Unsupervised Social Network Spam Detection http://www.cse.ohio-state.edu/hpcs/WWW/HTML/publications/papers/TR-13-6.pdf 若干読みきれてないが・・・ intro ソーシャルネットワーク上でのスパムアカウントが増加している。 スパムアカウント抽出に関して、教師付きの学習コストを抑える 観点から、教師なしの手法が望ましい。 まず、SD2という、ソーシャルネットワーク上の関係を織り込んだ スパム検出の手法を提案する。さらに、より高いレベルのスパム攻撃に 大して高い頑健性を持たせるために、UNIKという教師なしスパム抽出 手法を提案する。 2:データに関して 2009年のあるソーシャルブログサイトの10ヶ月分のユーザのつながりと投稿を収集 一度以上URL付きポストをしたユーザは176

    読んだ:Unsupervised Social Network Spam Detection(CIKM2013) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/12/03
  • 読んだ:Predicting User Activity Level in Social Networks(CIKM2013) - KIWAM_KEN_DIARY

    ソーシャルメディア上でのユーザの振る舞いに関する重要な指標は、ユーザの週次の活動レベルやアクティブかディアクティブかをクラス分類するようなアクティビティレベルである。この予測問題はSocialCRM(ソーシャル上のユーザの関係管理)を密接に関係している。 CRMの一例 誰かがある期間からインアクティブになるとき、それをその前の期間から潜在的インアクティブユーザとして予測すること SocialCRMは普通のCRMとは違う特徴がある。 ・ユーザの多様性 ・ソーシャル上の影響力 ・ソーシャルネットワークのダイナミクス ユーザのソーシャル上の多様性からなる特徴量は、包括的な予測モデルがすべてのユーザに対して適正ではないかも知れない。しかし、おのおののユーザの過去のデータはスパースすぎて質の高いパーソナライズなモデルは出来ない。 ユーザの影響力という特徴は、ユーザ間の関係が個々のユーザの予測結果をよ

    読んだ:Predicting User Activity Level in Social Networks(CIKM2013) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/11/27
  • CIKM読みたいリスト(読める奴だけ) - KIWAM_KEN_DIARY

    タイトルだけで選びました。はい。 DB系もグラフ関係多くて面白そうだけどとりあえずIRとKMだけから選択。 Content Coverage Maximization on Word Networks for Hierarchical Topic Summarization CQARank Jointly Model Topics and Expertise in Community Question Answering Estimating the Relative Utility of Networks for Predicting User Activities Parallel Motif Extraction from Very Long Sequences Predicting User Activity Level in Social Networks Unsupervise

    CIKM読みたいリスト(読める奴だけ) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/11/11
  • ICWSM読み会やりました(小規模) - KIWAM_KEN_DIARY

    社内の学術に興味あるマンな同期と@takayu_kとでICWSMの読み会やりました。 僕が読んだのがKAISTのチームで、ベストペーパーだったといううわさの Booming Up the Long Tails: Discovering Potentially Contributive Users in Community-Based Question Answering Services を読みました。 Icwsm読み会 from Akihiro Koide シンプルな話なのでなかなか面白かったです。 他の人が読んだのは、 Automatic Summarization of Events From Social Media あるイベントの要約をTwitterから獲得するために、尤もらしいTopK個のTweetを獲得するというもの。トピックモデルでは、基的にIIDを仮定しているが、Twi

    ICWSM読み会やりました(小規模) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/08/18
  • WWW13読み会(小規模)やりました - KIWAM_KEN_DIARY

    WWW13の読み会をしました。 @takayu_kと突発的に企画した内容でしたが、彼が会場設置から何からいい仕事してくれました。 弊社同期を2人誘って計4人で僕と@takayu_kが2づつ紹介して、残りを同期のLTにする形になる予定でしたが、思った以上に質疑が盛り上がって(主に僕の読み込み不足)、結局全部やり切れず、という感じでした。 Www13 slide from Akihiro Koide 僕は http://www2013.org/proceedings/p1331.pdf:Whom to Mention: Expand the Diffusion of Tweets by @ Recommendation on Micro-blogging Systems と http://userpages.uni-koblenz.de/~kunegis/paper/kunegis-adde

    WWW13読み会(小規模)やりました - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/07/08
  • メモ:What Is the Added Value of Negative Links in Online Social Networks? WWW13 - KIWAM_KEN_DIARY

    What Is the Added Value of Negative Links in Online Social Networks? signedネットワークについての論文 ネガティブリンクの特徴について調査. ネガティブリンクとは‐>foes…敵,distrust…不信 ネガティブリンクの予測をポジティブリンクだけを用いて行う. 高い正答率を出すのにネガティブリンクの特徴は不必要である! また、新リンクの付加価値を評価する方法論について述べる 2つのソーシャルネットワークで評価し、結果として、中心性を 近接性を組み合わせたリンク予測モデルがよさそう. また、ネガティブリンクの特徴は小さいが、付加価値の測定はできる ことを示す. ネットワーク1 Slashdot ユーザによって作成される技術系のニュースサイト ポジティブリンク…そのユーザの投稿を読みやすくなる ネガティブリンク…そのユ

    メモ:What Is the Added Value of Negative Links in Online Social Networks? WWW13 - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/06/24
  • メモ:Predicting Group Stability in Online Social Networks:WWW13 - KIWAM_KEN_DIARY

    Predicting Group Stability in Online Social Networks ソーシャルなグループはしばしば高度なダイナミズムを見せる.いくつかのグループが栄える一方で多くのもが時間の経過により消滅する.グループの安定性をモデリングし,グループが(いつ)安定して存続するもしくは時間の経過で衰退する(かどうか)を理解することは、多くの社会的な領域の中で重要なことだ.論文では、グループの安定性ダイナミクスのモデリング,予測の為に2つの異なったソーシャルネットワークを例に議論する.我々はグループが安定して存続するか帰還をへて衰退するかどうかを予測するためにモデルを構築する.我々は、メンバーの多様性の水準とソーシャルの活発さの両方が安定したグループの存続に重要であると観測した.また、一定の’多産な’メンバーがグループの安定した存続に重要な役割を果たすことを発見した.実

    メモ:Predicting Group Stability in Online Social Networks:WWW13 - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/06/17
  • JSAI参加してないメモ4 - KIWAM_KEN_DIARY

    JSAIはこれでラストにしよう 多重有向ネットワーク成長モデルの特性解析 現実の多重有向ネットワークがもつような特性を表現できる成長モデルの構築を目指す。 Twitterのお気に入りやRTを人の嗜好ネットワークと考えると、同じ人がつぶやくツイートを何度もお気にいりしたりRTしたりすることはよくある. モデルとしては、BAモデル(次数優先)を多重NWに拡張した多重BAと、CNNモデル(友達友達友達!)を多重に拡張した多重CNN. 多重BAの場合は新ノード+リンクを追加するか新リンクのみを追加するかの確率と、新リンク追加が選択されたときに多重リンクにするか否かの確率が用意されている. 多重CNNの場合は、はBAと同じで、、新リンク追加が選択されたときに多重リンクにするか、潜在リンクの顕在化を選択するかを確率で決定する. 実ネットワークとして、Twitterのお気にいる関係NW、Twitte

    sucrose
    sucrose 2013/06/09
  • JSAI参加してないメモ3 - KIWAM_KEN_DIARY

    ネットワーク構造が情報拡散に与える影響の分析 情報が拡散しやすいネットワーク構造を解明する為の分析. 情報の伝わりやすいネットワーク構造を把握するために4つの指標に着目. (1) 平均経路長 (2) クラスタ係数 (3) 同類選択性 (4) べき指数 これらの指標に任意の値(目標値)を与え、目標値通りになるようにネットワークを構築する. ステップ目のネットワークからステップ目のネットワークに成長する時、いくつかのネットワーク候補が存在するので、評価関数として、各指標の目標値と現状のずれを図り,この指標が最も小さくなるようなネットワークを選択するようにネットワークを成長させる. 候補ネットワークの作成には,次数優先、適応度優先(今回は一様)、近傍優先性を考慮したアルゴリズムを利用する. 各指標を動かし、さまざまな特徴をもったネットワークを作成し、そのネットワーク構造と情報拡散の期待影響度の大

    sucrose
    sucrose 2013/06/08