タグ

SNSとHyperEstraierに関するse-miのブックマーク (2)

  • かんたん友人検索 その弐 - mixi engineer blog

    朝のジョギング生活を絶賛継続中ですが、あまり体重が減らなくてショボンヌなmikioです。さて今回は、Tokyo Dystopiaを使った検索機能「かんたん友人検索」の設計と実装についてお話しします。 全体の戦略 Tokyo Dystopia(TD)は単なる全文検索用のインデックス管理ツールです。多数の文字列の中から特定のパターンを含んだ文字列を特定する処理を高速化することはできますが、逆に言えばそれしかできないのです。住所を市区町村単位で限定して結果を絞り込むとか、ログイン時間が近い順に並び替えるとかの高機能は備えていません。Hyper Estraierにはそういったアプリケーション寄りの機能を持たせていましたが、逆にコードベースが肥大化して保守や最適化がしにくくなってしまいました。その反省を踏まえて、今回は、「全文検索による対象の絞り込み」だけはTDにやらせて、その他の機能は全て専用に書

    かんたん友人検索 その弐 - mixi engineer blog
    se-mi
    se-mi 2008/09/17
    Tokyo Dystopia。MySQLだと3ホップのマイミクを調べるのに10000クエリ→非正規化
  • mixi Engineers’ Blog » R&D友の会

    ミクシィ研究開発グループでは定期的に社内で人を集めて研究進捗などの情報共有と交流を目的とした会を開いています。 研究開発グループは全社的にブラックボックス的に見られる事があり、例えばときどき"トールさんってどんな事をしてる人なんですか?"とコーヒーをすすっている時に聞かれる事があります。こういった状況は言うまでもなくよくありません(組織内での情報共有がなっていない事を示すから)。こういった理由から友の会が開催されました。友の会の発表は純粋に技術系の話ばかりですが、参加はスタッフであれば誰でも自由です。これは技術者だけでなく営業部や企画部などの参加者の方達から技術者以外の視点からの貴重な意見が頂けたりするからです。こういった狙いもあり我々はこの会に真剣に取り組んでいます。 又、同じグループメンバーでも私の専門外である高度なNLPテクニックを解り易くした話を聞けたりして勉強と刺激になります。モ

    mixi Engineers’ Blog » R&D友の会
    se-mi
    se-mi 2007/11/09
    「ガンガンスケールアウトできて、memcached級のスピードで形式を問わずデータの出し入れ、且つデータを永続的に保存できてHigh Availabilityの要求を満たす代物」これすごい。できたらぜひオープンソースで公開してほしい
  • 1