タグ

ブックマーク / voice.fresheye.com (4)

  • 検索メイニアック!: 怖い検索クエリ、怖いBig Brother

    職業柄、Web検索エンジンのクエリログ(入力された検索キーワードの履歴)の分析をやってみたいと思っている。 昨日偶然見つけたのが、米ユタ州の政府系Webポータルのクエリログを調べた下記の文献。怖い。 Chau, M., Fang, X. and Sheng, O. R. L.: What Are People Searching on Government Web Sites? Communications of the ACM, Volume 50, Number 4, April 2007, pp.87-92. クエリログから、以下のような物騒なクエリが見つかったというのだ。 radioactive waste storage (放射性廃棄物貯蔵庫) nuclear waste transportation route map (核廃棄物輸送ルート地図) 他にも、 nucle

    msk
    msk 2008/01/29
  • 検索メイニアック!: Information Retrievalというジャーナル

    国際論文誌Information Retrievalの編集委員を務めることになった。 来週Amsterdamで開催されるACM SIGIRの会期中、火曜日のランチタイムに編集委員会が開催されるので初参加する。 Information RetrievalのCall for Papers最新版。 NewsWatch, Inc.の名前がちゃんと入っている。 情報検索関連の代表的な国際論文誌と言えば、 ACM TOIS (Transactions on Information Systems) IPM (Information Processing and Management) JASIST (Journal of the American Society for Information Science and Technology) そしてInformation Retrieval

    msk
    msk 2007/07/23
  • 検索メイニアック!: tf-idf (ティーエフ・アイディーエフ)とKaren

    情報検索入門シリーズ。 "Maniac"という英単語は、あえてカタカナで書くならマニアックではなくメイニアックである。 そういうわけでこのブログのタイトルは「検索メイニアック」である。 さて、マニアックとメイニアックはどちらが一般的に使われる語だろうか? 「マニアック」のウェブ検索結果 「メイニアック」のウェブ検索結果 ということでマニアックの「ヒット数」のほうが圧倒的に多い。 この「ヒット数」のことを文書頻度(document frequency)という。略してdf。 「メイニアック」のようにdfの低い語のほうが、一般にはクエリターム(検索キーワード)として有用である。 つまり欲しい文書(個々の検索対象。例えば単一のウェブページ)を特定するのにより役立つ。 例えば、「検索」と「メイニアック」という2つのクエリタームで検索を行いたい場合、 「検索」のウェブ検索結果 を見

    msk
    msk 2007/06/11
  • フレッシュアイニュース - (404) ページがありません

    お探しのページが見つかりません(404 Not found) フレッシュアイをご利用いただき、ありがとうございます。 お客様がアクセスしようとしたページ(URL)またはサービスは見つかりませんでした。 トップページに移動して必要な情報をお探し下さい。 10秒後にトップページに移動します。 移動しない場合は、お手数ですが下記URLをクリックしてください。 http://www.fresheye.com/

    msk
    msk 2007/06/11
  • 1