11. 情強エミュレーションの実装TF-IDF怪しいウェブサイト正規サイトググる特徴語特徴語特徴語特徴語検査対象とドメインを比較ドメインが等しい:正規サイトドメインが不一致:フィッシングサイトCANTINA: A Content-Based Approach toDetecting Phishing Web Siteshttp://www2007.org/papers/paper557.pdf 12. 性能フィッシングサイト検知率 97.1%ブラックリストよりも格段に高い性能フィッシングサイト製作者が追記した部分を特徴語として選択してしまうと、特徴語が本家に含まれないので検索に失敗する正規サイト誤検知率 14.0%False positiveが多すぎて使いモノにならない原因は特徴語抽出の失敗模倣コンテンツの特性に基づくフィッシング検知方式の誤検知防止http://www.yoshiura.