タグ

ryoと*web2.0に関するkanbayashiのブックマーク (4)

  • 2006-08-23

    ⊂( ⊂(´_ゝ`)ぐー 今年の特別演習は、はてブでコラボレイティブフィルタ*1をしようというのを提案してやることになったんだけど、それについての担当教官とのミーティングが29日にある。 というわけで、そろそろ、夏休みの成果を作らなくてはいけない。じゃないと、「何もやってましぇーん」って言うだけになってしまう。それは困る。 よーし。Let's 実装!! とりあえず、はてブの新着エントリのページから、一万エントリ分ほどクロールして*2、ユーザとページをキーとする2次元の疎行列を作る*3。 そして、コラボレィティブフィルタのアルゴリズムを実装。ネタはバラすと感動がなくなるので、バラさない。もしくは、また今度。 で、テストしてみると、それっぽい答えは一応返ってくる。ただ、アルゴリズムが正しく実装されているのか微妙なところがあるので*4、どうなのやら。 とりあえず、もうちょっと頑張ってみまする。

    2006-08-23
  • 2006-07-20

    ⊂( ⊂(´_ゝ`)ぐー Kikkerの内部動作を結構大きく変えた。 というのも、今までのKikkerは一つのURLを解析するために、Bulkfeedsの形態素解析 APIを一回リクエストして、んでもって、Yahooで8個ぐらいのキーワードについてヒット数を調べてたのね。 ただ、この処理がすごーく重くてクローラの性能を制限してたから、この部分を全て自前でやることにした。 とは言っても、TF-IDFのIDFの部分をchasenの持ってる辞書の生起コストで置き換えただけなんだけど。 というわけで、今のKikkerは独り立ちしました。ただ、まだまだ若造なので抽出するキーワードがおかしいかもしれません(´ヘ`;) しかーし、クロールのコストが減ったので、その分各URLについてより大きなベクトルを得られるようにしました。よって、推薦の精度は上がるんじゃないかな(ベクトル計算の計算量が増えたのでページ

    2006-07-20
  • http://ryogrid.myhome.cx:3000/search

  • Web2.0 時代の情報収集の新しい手法 〜Kikker 開発者 神林氏にお聞きする〜 - Ceekz Logs (Move to y.ceek.jp)

    タイトルは、P2P today ダブルスラッシュにインスパイヤされました。当にありがとうございます。 ということで、後輩の神林くんが Kikker という面白いサービスを立ち上げているので、インタビューしてみました。流行のポッドキャスティングには未対応です…。録音しておいて、それを字におこすのがかったるいので、メッセンジャーでインタビューを行いました。 「Kikkerの開発者に聞く100の質問」とかいうバトンじみたものではないので、ご安心を。 それでは、始まり始まり。 - まずは、Kikker の概要を教えてください。 Kikker は、ユーザーの趣向情報を分析してそれに従った情報を集めてこようというシステムです。『Web2.0 時代の情報収集の新しい手法』と謳っています。 - 具体的には、どのような機能があるのでしょうか? ユーザの好きそうなはてブックマークのエントリや CEEK.JP

  • 1