2014年1月16日のブックマーク (2件)

  • Twitter APIでRTしたフォロワーを分析してインフルエンサーを探す

    topsyというサイトでやっているインフルエンサーの判定(リツイートの影響力のある人)。TopsyのAPIが無料であればよかったのですが、お金がかかりそうなので、あれを自前でできないかいろいろやってみた結果をまとめてみます。 はじめに まずはじめに考えたのが、「自分がつぶやいた内容をリツイートした人に中から、再リツイートされた回数が高いフォロワー」をインフルエンサーとして判定する方法。ただ、TwitterAPIでは、「誰のリツイートを再リツイートしたか」という情報は取得できず、再々リツイートであっても自分のつぶやきに対するリツイートとして扱われる。なので簡単にはできそうにない。 リツイートのリツイートされ数(被リツイート率)が高いユーザーが影響力のある人と考えられる。上図ではABCの中ではBの人が影響力が強い。 リツイートツリーの復元 どうしようもないので、いろいろ探していたら、電気通信

    Twitter APIでRTしたフォロワーを分析してインフルエンサーを探す
    devorgachem
    devorgachem 2014/01/16
    Topsyのインフルエンサー判定とそれぞれの判定の比較をみてみたいところ。暇なときに調べてみようかな。
  • 自分の英語文書をマイニングして次に学ぶべき単語リストを自動生成する方法(暦本式語彙増強法) - NextReality

    英単語の語彙をどうやって増やしたらいいだろうか。やみくもに単語集みたいなものを順に覚えていくのも道程が長そうだ。また、一般論ではなく自分がよく書く分野に特化して語彙を増やしたい。ということで、テキストマイニングを使ってやる方法を考えてみた。方針は以下の通りである: 自分が今までに書いたすべての(英語)の文書を解析して、品詞ごとに出現回数でソートする。 つぎに、自分の所属するコミュニティの文書(たとえば自分がよく参加する学会に掲載される論文など)をなるべく大量にあつめて、同じように品詞ごとに出現回数でソートしておく。 両者を比較して、そのコミュニティでは使用頻度が高いにも関わらず、まだ使ったことのない単語を抽出して自分専用の「単語集」をつくる。 こうやって抽出された単語集を勉強すれば、一般的な単語集を使うよりも効率がいいのではないだろうかという目論みだ。対象となる分野を選んでいるのは、たとえ

    自分の英語文書をマイニングして次に学ぶべき単語リストを自動生成する方法(暦本式語彙増強法) - NextReality
    devorgachem
    devorgachem 2014/01/16
    自分で書いたreadmeでやってみようかな