タグ

researchとblogに関するHISAMATSUのブックマーク (5)

  • ニフティ、スパムブログのフィルタリング技術を開発、ブログの4割をスパムとして検出

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    ニフティ、スパムブログのフィルタリング技術を開発、ブログの4割をスパムとして検出
    HISAMATSU
    HISAMATSU 2008/03/26
    うーん,卒論のネタになるかなぁ.
  • メディア・パブ: 有益ブログのトップ100,米カーネギーメロン大の研究論文より

    読むべき有益なブログとは・・・。 米カーネギーメロン大の研究者が,役立つブログを理論的に評価する手法を論文で発表し,その中でトップ100ブログを掲げていた。 ここでは,そこからトップ20のブログを抜き出した。 1.Instapundit 2.Don Surber 3.Science & Politics 4.Watcher of Weasesls 5.Michelle Malkin 6.National Journal's Blogometer 7.The Modulator 8.BloggersBlog.com 9.Boing Boing 10.Atrios 11.A Blog for All 12.Gothamist 13.mparent777 14.TFS Magnum 15.Alliance of Free Blogs 16.anglican.tk 17.Micropersuasi

    HISAMATSU
    HISAMATSU 2007/11/01
    かならず、よむこと。
  • トラックバックスパム対策をまとめてみる - Tomo’s HotLine

    IT技術を中心に、暮らしに役立つ情報からクラシック音楽の解説まで気軽に情報発信しています。 WEBサイトはhttp://toremoro21.world.coocan.jp/ Twitterは@toremoro21です。 最近トラックバックスパムがひどいので対策方法をまとめてみました。どのくらいひどいかというと1日10件ぐらいくるときがあります。(もしかして少ない方?) 対処方法をまとめると以下のような感じかな。多分抜けや漏れは一杯あると思うので、誰かがきちんとまとめてくれるとうれしいです。 ・blogサイトにユーザが通報 メリット:サイト側の実装が簡単。(のように思える) デメリット:新手のスパムには対応しにくい。ユーザが少ないと効果が薄い。 *ココログが採用している。 ・トラックバックスパムの特徴で判断 トラックバックスパムの特徴の一つとしてBlog内容がリンクしかない等があります。こ

    トラックバックスパム対策をまとめてみる - Tomo’s HotLine
    HISAMATSU
    HISAMATSU 2007/07/18
    トラックバックという機能自体がだめなんかな。イタチごっこになるだけのような。。。
  • ブロガーの“生の声”を抽出する評判検索

    リクルートと電通などが出資するブログウォッチャーは、ブロガーの生の体験談だけを抽出できるという評判検索サイト「SHOOTI」(シューティー)を7月3日に公開する。東京工業大学の奥村学准教授と共同開発したサービスで、ブログやレビューサイトなどの記事からうわさや他人の受け売りなどを排除し、人の体験談と評価だけを抽出できるという。 サイトには、旬のキーワードに関する編集記事も掲載して読者を集め、リクルートグループ各社の広告媒体として活用するほか、評判抽出の仕組みを、グループのサイトや他社サイトに提供する計画だ。 ブログウォッチャーは4月2日に設立。資金・資準備金はそれぞれ5000万円で、リクルートが79%、電通が20%、奥村准教授が1%出資している(関連記事参照)。 SHOOTIは、ブログやレビューサイト、掲示板など約1000万の記事をクローリングし、ネットユーザーの“生の体験談”から評判

    ブロガーの“生の声”を抽出する評判検索
    HISAMATSU
    HISAMATSU 2007/07/06
    特化型の検索エンジン。technorati をさらに特化させた感じかな。
  • イベントドリブン型静的生成ブログツールの提案 - 最速配信研究会(@yamaz)

    動的生成のブログツールの魅力 ARTIFACT ―人工事実― 静的生成のブログツールの魅力 絵文録ことのは Blogツールのコンテンツ生成はどうするのがいいのか話されている.詳しくは上記リンクを 参照してもらいたいが,おおざっぱに問題を整理すると下記のような感じ. 動的生成 → 変更に強いが常にDB参照なのでサーバの負荷がかかる. 静的生成 → サーバ負荷はちょろいが全データの再ジェネレートに時間かかる. 結論: 一長一短だからまぁ用途によって使い分けるのがいいのかもね. たまたま似たような問題にぶつかっていろいろ考えていたところなので,私が行おうとしてる解決方法を紹介したい.考え漏れとかあるかもしれないので,ツッコミ大歓迎です. ブログの立場からはDBとくにMySQLやPostgreSQLのような重量級のDBMSから直接データをひくという解決はあり得ない*1.かといってデザインを変更す

    イベントドリブン型静的生成ブログツールの提案 - 最速配信研究会(@yamaz)
  • 1