タグ

ブックマーク / repose.hatenadiary.jp (3)

  • HTML要素に着目した違法・有害サイト検出手法の提案と評価 読んだメモ - 糞糞糞ネット弁慶

    HTML要素に着目した違法・有害サイト検出手法の提案と評価(pdf) 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch HTMLタグ内の記述に着目し、ウェブサイトの背景色が例えばピンクであることや、画像リンクが多用されていること、フレームが多用されていること、ポップアップなどブラウザーに特定の動作をさせるスクリプトが用いられているといった外形的特徴を捉えることで有害サイトを検出する。 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch この記事で触れられていたのはこの論文であるとある方から教わったので読んだ. 目的 違法・有害サイトを検出したい. Black/While list形式だとコストがかかる,同一ドメインにコンテンツが混在するためめんどくさい,新規

    HTML要素に着目した違法・有害サイト検出手法の提案と評価 読んだメモ - 糞糞糞ネット弁慶
  • 練習がてらいくつかのquery suggestionアルゴリズム実装した - 糞ネット弁慶

    というわけでquery suggestionのいくつかの手法をC++で実装した。非常に実装が汚い。 GitHub - ybenjo/AAQS: All About Query Suggestion algorithm 手法としては以下の4つ。 Automatic multimedia cross-modal correlation discovery Entropy-biased models for query representation on the click graph A generalized Co-HITS algorithm and its application to bipartite graphs Query suggestion using hitting time しかし実装したはいいがクエリ推薦なんて個人じゃ使い道がない。なので、ユーザ⇔映画やユーザ⇔商品やグ

    練習がてらいくつかのquery suggestionアルゴリズム実装した - 糞ネット弁慶
    hiromark
    hiromark 2010/07/27
    じっくりよみたい。
  • ゼミのちはじめてのカーネル法 - 糞ネット弁慶

    春からやってたPRML自主ゼミが無事上巻を終えた感じなので下巻に移ろうとするも下巻のトピックの説明具合が所々不穏じゃねということで、まずはカーネル法を これを使ってやってみようという話になった初回のゼミ。 で、導入という事でリプレゼンター定理を見たわけですが、リプレゼンター定理の証明がシンプルで納得。この凄いので早く研究室で注文した分も届いてください。 リプレゼンター定理とは、損失関数に正則化を加えて最適化する問題において、正則化項がL2ならば、最適解はをサンプル点として の形で書けるというもの。 「おーL2正則化だとが消えていい感じにサンプル個のカーネル線形和で書けるのかー」とか言ってたらid:syou6162が「甘い、これまでのL2正則化入りのパラメータ推定もカーネルで記述可能だと示唆しているんだ!!!!!!(ここ適当」とか言い出してうおーそりゃもっとすげーとかいう感じで終了。 あと

    ゼミのちはじめてのカーネル法 - 糞ネット弁慶
  • 1