エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
まとめてブログ検索 開発日記 スパムブログフィルターについて考察。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
まとめてブログ検索 開発日記 スパムブログフィルターについて考察。
まとめてブログ検索 開発日記 「まとめてブログ検索」の開発日記です。http://hirashi.mydns.jp/metablo... まとめてブログ検索 開発日記 「まとめてブログ検索」の開発日記です。http://hirashi.mydns.jp/metablogsearch/ 普通にブログ検索をすると、スパムブログっぽいものが大量に出てきてしまうので、まとめてブログ検索では自前でスパムフィルター処理を行っております。 1ヶ月ほどずっと様子を見てきて、多少スパムブログたちの傾向が把握できてきました。それをふまえて、現在は次のような方策でスパムフィルターをしております。 ■1 url単位でスパム認定 ニュース記事のコピーエントリーばかり繰り返しているようなブログサイトがいっぱいあるわけです。そいつらにはurl指定でのブロックがとてもよく効きます。 ■2 特定のワード群による指定 「NGワードリスト」というのを自前で用意して、そのうちの一定数以上が含まれているエントリーはスパムとみなす、といった処理を行っています。 スパム