タグ

ブックマーク / www.mtoyoda.com (3)

  • WWW2009のサーベイ@情報爆発キックオフ - 豊田正史のSLとは関係ございません(2009-05-14)

    _ [学会] WWW2009のサーベイ@情報爆発キックオフ 情報爆発のキックオフミーティングでWWW2009の15分サーベイという無謀な試みをやらされたので、発表資料を以下に置いてみます。キーノート2、論文数の多い3セッションから流行りを抜き出すため、タイトル、アブストをタグクラウド化してトレンド論文をリストアップ。いくつかの論文についてちょっとだけ紹介。と言う形にしました。全体的に、Yahoo!, MSの論文が多く、ちょっとおもしろ目のアイデアを、検索エンジン会社の実データで実験してしっかり評価するという論文が多く通っている印象です。大学の教員が企業を兼務していたり、インターンの学生が検索エンジン会社に行って仕事したのをまとめていたりと、企業と大学の連携がうまくいっているということでしょうね。 WWW2009survey.pdf

    WWW2009のサーベイ@情報爆発キックオフ - 豊田正史のSLとは関係ございません(2009-05-14)
    toruto
    toruto 2009/05/14
    「情報爆発のキックオフミーティングでWWW2009の15分サーベイという無謀な試みをやらされたので、発表資料を以下に置いてみます。」
  • リンクスパムの分布図 - 豊田正史のSLとは関係ございません(2008-03-05)

    _ [研究] リンクスパムの分布図 PageRankのようなリンクに基づく検索結果ランキング手法を騙そうとする行為をリンクスパムと呼びます。大量にドメインを確保したり、業者同士で結託したりして、密なリンク構造を構成するのが簡単な方法です。日語ウェブアーカイブから、そのほんの一部を抽出してグラフ構造を可視化すると以下のようになります(丸はサイトの集合で、線はサイト集合間のリンク)。真中のグレーの丸は、ウェブグラフの中心にあたります。これは全サイトの3分の1くらいが含まれる巨大な強連結成分で、良いサイトも悪いサイトも山ほど含まれています(中の数字は、含まれるサイト数)。その周りに浮遊している黒い丸が、スパムサイトからなる強連結成分です。1つ1つに数百から数千の相互に強く結びついたスパムサイトが含まれています。スパムの強連結成分同士がまた密な構造を作っていてなかなか興味深い図になっています。昨

    リンクスパムの分布図 - 豊田正史のSLとは関係ございません(2008-03-05)
    toruto
    toruto 2008/03/05
  • 大学院講義「ウェブ工学」のネタ選び - 豊田正史のSLとは関係ございません(2007-08-13)

    _ [大学] 大学院講義「ウェブ工学」のネタ選び 10月開講の「ウェブ工学」で何をネタにするかそろそろ考えなくてはいけない。ウェブ工学ってなんだってのはひとまず置いておいて、ウェブ関係のネタで研究ができるようになることを目標とし、それに必要な基礎知識はなにか、というあたりから考えていくことにしよう。とりあえず思いついたものから挙げてみる。 The Anatomy of a Search Engine まずは、これを読めるような基礎知識を教えないといけないだろう。これの後に、この手のサーチエンジンアーキテクチャ論文ってあるのかな?あ、Anna Pattersonの記事とかあったなあ。 Tech Report: SRC-RR-175: The Link Database: Fast リンクデータベースの作り方。PageRankやHITSなどを実際にウェブのスケールで計算しようとするとこのあたり

    大学院講義「ウェブ工学」のネタ選び - 豊田正史のSLとは関係ございません(2007-08-13)
    toruto
    toruto 2007/08/14
    「ウェブ工学」という名前の付け方がある種危険な気もする。内容は聞いてみたいのだけど。
  • 1