タグ

algorithmとSPAMに関するk_37toのブックマーク (3)

  • ワードサラダ技術について

    後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である ということです。 さて、実例です。たとえば次の文章を考えてみます。 「通信販売大手セシールは9日、生命保険の販売に格参入する方針を明らかにした。」 まず形態素解析するとこんな感じになります。 通信 名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン 販売 名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ 大手 名詞,一般,*,*,*,*,大手,オオテ,オーテ セシール 名詞,固有名詞,組織,*,*,*,セシール,セシール,セシール は 助詞,係助詞,*,*,*,*,は,ハ,ワ 9 名詞,数,*,*,*,*,9,キュウ,キュー 日 名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ 、 記号,読点,*,*,*,*,、,、,、 生命 名詞,一般,*,*,*,*,生命,セイメイ,セイメイ 保険 名詞,一般

  • [ThinkIT] 第4回:押さえておきたいスパムフィルタの技術 (1/3)

    これまでスパムフィルタの選定基準やベンチマークテストの手法について解説してきましたが、今回は改めてスパムフィルタを支えている技術について紹介します。自社の企業システムに適したスパムフィルタを選定する上で、フィルタの仕組みやメリット・デメリットを知ることは大変重要です。 なぜなら製品選択によって、メールユーザや管理者の業務が天と地ほど異なるからです。また、「長期に渡って信頼できる技術を選択したい」「現在利用している技術はどのような位置づけなのか知りたい」あるいは「よりよい技術や利用法を知りたい」という方は、やはりある程度スパムフィルタ技術を理解する必要があるでしょう。 しかしスパムフィルタを支える技術は、コンピュータ技術の中でも難解である上、日々進化しています。しかも残念なことに、スパムフィルタ技術を知るための資料はあまり存在していません。そこで、今回は現在市場に出ている技術について、実際の

  • Microsoft,“スパム・ページ”を識別する新技術を開発

    Microsoftの研究部門は,広告サイトなどへの誘導目的で設置されるスパム的なWebページ(スパム・ページ)やブログを識別する技術「Strider Search Defender」を開発した。同技術を使えば,Webページの内容を解析することなく,そのページがスパムかどうか判定できるという。 こうしたスパム・ページの運営者は,広告サイトなどへリダイレクトするようなWebページやブログ・ページを大量に用意しておく。そのうえで,検索エンジン最適化(SEO)の手法を用いて,スパム・ページが検索結果の上位に表示されるようにする。さらに,一般のブログや掲示板に誘導コメントを投稿する「コメント・スパム」,誘導目的のトラックバックを送る「トラックバック・スパム」といった手口も使う。 従来の対策では,各Webページの内容を解析してスパム・ページかどうかを判断していたという。それに対しStrider Se

    Microsoft,“スパム・ページ”を識別する新技術を開発
  • 1