yogasaのブックマーク - はてなブックマーク

類似性を探そう！ - てっく☆ゆきろぐ
FreeBSD、MacOSX、Webアプリ系、RDBMS(PostgreSQL)などの話題が中心になるかと思います。ふぁぼったーという、twitterのfavoriteをカウントして集計してくれるサービスがあるのですが、たまに似たようなものというか、ほとんど同じものがふぁぼられてることがあります。似たようなものを排除できないかなーと思って、いろいろ考えてみました。というか、実況で同一postで並んでるのをひたすらfavoriteして、TOPが埋まって鬱陶しいんですよ！方針はこんなかんじ。 1.ふぁぼったーの「人気」から上位・・・だいたい10ページ分を取得 2.HTMLを解析してデータ抽出（スクレイピング） 3.抽出したデータをデータベースに突っ込む 4.突っ込んだデータをもとに、類似性を計算 1〜3は Ruby 、 4は(モジュール等の関係から) Perl を使いました。 1.ne
yogasa 2009/09/26
ふぁぼったー

自然言語処理

twitter
リンク
twitterでOAuthを使う方法（その１：認証まで） - てっく☆ゆきろぐ
FreeBSD、MacOSX、Webアプリ系、RDBMS(PostgreSQL)などの話題が中心になるかと思います。 OAuthって結構難しいと思われてるようですが、難しいというよりは、『ややこしい』です（苦笑）そんなわけで。手順毎に順番に説明をしようと思います。 ※2009/09/23 説明の図（手書きでごめんなさい）追加しました。 ●語句の説明・サービスプロバイダ(service provider)・・・サービスを提供しているところ。この場合、twitter。・ユーザ(user)・・・サービスプロバイダに登録していて、そのサービスを利用している人。・コンシューマ(consumer)・・・サービスを提供しているところに、ユーザにかわって、そのサービスに対してアクセスする第三者。サードパーティ、とでも言うべきでしょうか。要は、この記事を見て「何か作ってみたい」という、あなたです。
yogasa 2009/09/26
twitter

OAuth
リンク
1

はてなブックマーク

タグ

ブックマーク / sayama-yuki.cocolog-nifty.com (2)

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / sayama-yuki.cocolog-nifty.com (2)

類似性を探そう！ - てっく☆ゆきろぐ

twitterでOAuthを使う方法（その１：認証まで） - てっく☆ゆきろぐ

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス