2008年7月16日のブックマーク (1件)

  • Masanobu TSURUTA

    Masanobu TSURUTA / 鶴田雅信 研究対象 Webページからの主要部分抽出 Webページに含まれる情報を検索、マイニングなどに有効活用するために必要な前処理である、主要部分/文抽出技術の研究を行っています。ツール、研究で使用したデータのうち、著作権などの問題のないものはここで公開する予定です(夏までには)。 レター Masanobu Tsuruta, Hiroyuki Sakai, Shigeru Masuyama, An Informative DOM Subtree Identification Method from Web Pages in Unfamiliar Web Sites, to appear in IEICE Trans. Information and Systems, Vol.E91-D No.4 pp.986-989, 2008. 国内学会 未知の