タグ

ブックマーク / blog.yappo.jp (2)

  • YappoLogs: WWW::2chを正式リリース

    WWW::2chを正式リリース 2ちゃんねるのスレッドを簡単に取り扱うWWW::2chをCPANにageました。 WWW-2ch-0.04 ・ローカルにあるdatをパースするメソッドの追加 ・キャッシュされているdatを取り出すメソッドの追加 ・各プラグインで利用するサイトのencodeの取得 ・Jbbsのサポート などが追加されています。他にも痒いとこに手が届きそうなものも追加してます。 上2つはサーバに接続をせずに手元のデータだけを使用しているので 一度取得したdat等を後でデータマイニングしたい場合に有効になります。 ただしhttp://www.2ch.net/ 2ちゃんねるのデータの利用に関して、原則的に自由ですが、 2ちゃんねるのデータ自体を利用して対価を取る行為はご遠慮下さいには注意してくださいです。 各種データをサーバから取ってくるときも極力余計な通信を発生させないように注意

  • YappoLogs: ファイルシークを研究してみる

    ファイルシークを研究してみる ■ファイルシークとは ファイルシークはWeb検索、待受画像検索、着メロ・着声・着うた検索、各種辞書等の強力な検索機能が統合された業界最大級のデータ量を誇る携帯端末用サーチエンジンです。特に待受画像検索エンジン(通称:画像ファイルシーク)は総数で数百万枚もの待受画像をキーワード検索でき、2001年のサイト開設当初から大人気のコンテンツです。ファイルシークのアクセス数は月間約6,000万PVを誇ります。という、一日に約200万PVも稼ぐ検索サイトだそうです。 提供サイトもなかなかユニークなので色々と調べてみました。 あくまでも予想ですから、実際と異なる可能性が大です。 サービス別特徴 携帯サイト検索 提供ホスト:web.fileseek.net オリジナルデータから検索しています。 待受/着メロのデータと共用しているようで、各検索結果固有のデータも表示され

  • 1