タグ

spamに関するsleepy_yoshiのブックマーク (8)

  • スパムブログ研究 splogサーベイ : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 splog率 各社からの回答 splog フィルタリングには、大別して リンク解析 コンテンツ解析 とがあります.... ワードサラダ(word salad)など、細切れの単語が並んでいる場合は、通常のコンテンツ解析ではうまくできず、 相補的にリンク解析を用いるべきケースがあるでしょう。 「検索エンジンスパムの解決法を公開する人はいない」 その価値の高さから、Yerazunis氏は、学者たちもその方法を秘匿しているのではないかと疑っている。仮にある学者が民間企業よりも早くその解決法を発見したら、その学者は間違いなく、

    スパムブログ研究 splogサーベイ : 研究開発
  • splogに関するサーベイ : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 surveyというか、 論文紹介程度です。 3月10日(月)発表前のはずですが、なぜかもう見えます。 神門先生の名が入ってます。名前だけかもしれません。 キーワードの時系列特性を利用したスパムブログの収集・類型化・データセット作成: 佐藤有記、宇津呂武仁(筑大)、福原知宏(東大)、河田容英、村上嘉陽(ナビックス)、中川裕志(東大)、神門典子 (NII) ※ちなみに、データセット作成とタイトルにありますが、 このデータセットを評価用に外部の人間にも使わせてくれればいいのに 使わせてはくれないようです。 splogの定義

  • 現代マーケティングを知る - spamassassin.jp

    ご訪問いただきありがとうございます。 こちらは、オンラインマーケティングのさまざまな手法を紹介しているサイトです。 インターネットの発達とともにがらりと変わったマーケティング インターネット登場以前、マーケティングの主なフィールドは、郵便の他、テレビ、ラジオ、新聞などのマスメディアに限定されていました。多くの人に宣伝ができるとはいえ、その範囲は国内にとどまっており、時間や場所の制約があったのです。 しかし、インターネットはその制約を取り払いました。現在では、世界中の人に時間や場所を超えて自社のPRができるようになったのです。オンライン便利性を利用し自社の顧客からの意見や要望も簡単に入手できるようになったり、さらに、SNSや強力な検索エンジンの登場でその選択肢は拡大されました。 それに伴い、たくさんのマーケティング手法やいかに上手に行えているかの診断方法などたくさんのテクニックや情報が増えた

    現代マーケティングを知る - spamassassin.jp
  • HTML要素に着目した違法・有害サイト検出手法の提案と評価 読んだメモ - 糞糞糞ネット弁慶

    HTML要素に着目した違法・有害サイト検出手法の提案と評価(pdf) 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch HTMLタグ内の記述に着目し、ウェブサイトの背景色が例えばピンクであることや、画像リンクが多用されていること、フレームが多用されていること、ポップアップなどブラウザーに特定の動作をさせるスクリプトが用いられているといった外形的特徴を捉えることで有害サイトを検出する。 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch この記事で触れられていたのはこの論文であるとある方から教わったので読んだ. 目的 違法・有害サイトを検出したい. Black/While list形式だとコストがかかる,同一ドメインにコンテンツが混在するためめんどくさい,新規

    HTML要素に着目した違法・有害サイト検出手法の提案と評価 読んだメモ - 糞糞糞ネット弁慶
  • Evaluating E-Discovery

    Well, after a couple of years at FTI, and some, ahem, self-funded gardening leave, I'm back to consulting---and to blogging! More from me soon. Tomorrow I'm starting a new, full-time position as data scientist at FTI's lab here in Melbourne. I'm excited to have the opportunity to contribute to the e-discovery community from another angle, as a builder-of-product. Unfortunately, this means the end

  • 404 Not Found

    404 Not Found We've been cleaning house on our website! Q. Looking for something that used to be on the old website? See https://spamassassin.apache.org/old/

    sleepy_yoshi
    sleepy_yoshi 2009/08/27
    SpamAssassinが公開するspam/hamデータ
  • モバイル検索の動き他(ブクマ)《携帯 電話》 - 携帯 電話の噂の真相

    sleepy_yoshi
    sleepy_yoshi 2009/02/21
    最近のワードサラダはすごい.一瞬わからなかった
  • Web Spam Detection

  • 1