タグ

mixiに関するteahutのブックマーク (11)

  • かんたん友人検索 その弐 - mixi engineer blog

    朝のジョギング生活を絶賛継続中ですが、あまり体重が減らなくてショボンヌなmikioです。さて今回は、Tokyo Dystopiaを使った検索機能「かんたん友人検索」の設計と実装についてお話しします。 全体の戦略 Tokyo Dystopia(TD)は単なる全文検索用のインデックス管理ツールです。多数の文字列の中から特定のパターンを含んだ文字列を特定する処理を高速化することはできますが、逆に言えばそれしかできないのです。住所を市区町村単位で限定して結果を絞り込むとか、ログイン時間が近い順に並び替えるとかの高機能は備えていません。Hyper Estraierにはそういったアプリケーション寄りの機能を持たせていましたが、逆にコードベースが肥大化して保守や最適化がしにくくなってしまいました。その反省を踏まえて、今回は、「全文検索による対象の絞り込み」だけはTDにやらせて、その他の機能は全て専用に書

    かんたん友人検索 その弐 - mixi engineer blog
    teahut
    teahut 2008/09/16
    cardinalityの低い属性絞り込みは,全userを固定長配列で表現して逐次照合.マイミク距離によるscoringは,(my ID, [friend1, friend2, ...]) というhashを作っておき,3 hopまで探索 (検索あたり10Kq要するが,2Mqps 捌けるのでなんとかなる)
  • mixi Engineers’ Blog » Tokyo Tyrantによる耐高負荷DBの構築

    連休中はWiiのマリオカートをやりまくってやっとVR7000越えたmikioです。愛車はマッハ・バイクとインターセプターです。さて今回は、分散ハッシュデータベースサーバTokyo Tyrantでmixiの最終ログイン時刻を管理するようにした時の苦労話を書きます。 ログイン処理は負荷地獄 mixiでは、全てのユーザについて、各々の最終ログイン時刻を管理しています。「マイミクシィ一覧」や「お気に入り」などの画面で、友人が近い時間にログインしていてコミュニケーションがとりやすい状態にあるかどうか確認できるようにするためです。 mixiのほぼ全てのページはログインしないと見られないページなので、ほぼ全てのページにアクセスされるたびにログイン確認が行われます。したがって、最終ログイン時刻はほぼ全てのページにアクセスされる度に更新されることになります。mixiの中で最も重いデータベースのひとつとして「

    mixi Engineers’ Blog » Tokyo Tyrantによる耐高負荷DBの構築
    teahut
    teahut 2008/05/07
    >Tokyo Tyrantで最終ログイン時刻を管理... レコード数はユーザ数とほぼ同じで各レコードのサイズは30バイト未満... ピーク時には10000QPSを大きく越える負荷(同時接続数も10000クライアント強)... active master1台+standby master1台
  • http://mixi.jp/issue_ticket.pl は OpenID server だったよ - 知らないけどきっとそう。

    mixiのURLにOpenIDっぽいパラメータがくっついてる件 http://blog.fkoji.com/2007/08051128.html OpenID大好きなので、少し調べてみました 結論から言うと、news.mixi.jp とか video.mixi.jp とかの、mixi.jp と別ドメインにセッションを引き渡すために使ってるぽい このあたりの話のあと、cookiedomain指定をやめたのかもしれない http://kaede.to/~canada/doc/mixi-and-cookie リクエストのやりとりはこんな感じ ログインしてcookieもらう(domain指定なしなので mixi.jp にしか渡されない) POST /login.pl HTTP/1.1 Host: mixi.jp HTTP/1.x 200 OK Set-Cookie: BF_SESSION=***

    http://mixi.jp/issue_ticket.pl は OpenID server だったよ - 知らないけどきっとそう。
    teahut
    teahut 2008/01/04
    >news.mixi.jp とか video.mixi.jp とかの、mixi.jp と別ドメインにセッションを引き渡すために使ってるぽい... openid.identity は自動で自分のプロフィールページがセットされる模様... 普通のOpenIDサーバとしては使えない
  • mixi Engineers’ Blog javascript

    teahut
    teahut 2007/12/06
    >元となる言葉と同じ日記または同じ文章でよく使われる言葉は関連語だと判断... 共起頻度データベース... 言い替え表現... 両者の傾向が類似しているので言い替えなのではないかと推測
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • WWW::Mixi::Scraper 0.07 - Charsbar::Note

    昨日のリニューアルに対応した0.07をCPANにアップしました。手元のlive testsは全部パスしていますが、環境によってはまだうまくとれないものがあるかもしれません。おかしなところを見つけた方はcodereposにコミットするか、立場上おおっぴらにコミットするわけにはいかないお方はCPANのメールアドレスあたりにパッチを投げていただけると助かります。 PlaggerでCustomFeed::Mixiを使っていた方は、代替品のCF::MixiScraperもあわせてどうぞ(ネームスペースの問題とかあるのでまだ家にはコミット申請していませんが、どうしましょうね)。 #追記:家にコミットしました。

    WWW::Mixi::Scraper 0.07 - Charsbar::Note
  • mixiステーション2.2.1で追加されたAPIの発掘 « ku

    mixiぜんぜん知らないので前からあったのかもですが、mixiステーションのバージョンが2.2.1になって mixi toolbar っていうのが追加になっていました。 インストールしているときに出てくるダイアログに mixi toolbar というのが出てくるのですが、なんかインストールしてもデフォルトでは表示されないみたいなので(自分の環境だけかも)、自分でIEのメニューから[表示]/[ツールバー]/[mixi] を選んで表示させる必要がありました。そうするとIEにmixi toolbarが出てきます。 id:HolyGrail誕生日おめでとう。 以下恒例のAPI発掘結果です。ちなみに認証はmixiのあしあとAPI発掘のとき同じでWSSEもしくはcookieでできました。 マイミク一覧 http://mixi.jp/atom/friends/r=1/member_id=myMixiID

    teahut
    teahut 2007/08/02
    >マイミク一覧, マイミク日記、コミュニティなど最新更新一覧... (path は .../-/diary|album|review|video|comment のように GData に似せている)
  • blog.8-p.info : mixi に写真をアップロードする

    mixiの新着情報をタスクトレイに通知、ミクシィが専用アプリを強化:ニュース - CNET Japan ミクシィは6月28日、同社が運営するSNS「mixi」の専用アプリケーション「mixi station」に、フォトアップローダー機能と新着お知らせ機能を追加した。 写真のほうをちょっと見てみたら Atom みたいです。こんなスクリプトで最初のアルバムに写真を追加できます。 use strict; use warnings; use XML::Atom::Client; use XML::Atom::Service; use File::Slurp; sub get_first_album { my ($client) = @_; my $service = $client->getService('http://photo.mixi.jp/atom/r=3'); for my $c ($

    teahut
    teahut 2007/07/02
    >写真のほうをちょっと見てみたら Atom みたいです。こんなスクリプトで最初のアルバムに写真を追加できます。
  • glucose : mixi stationにグルコースのglucose nano frameworkが採用

    株式会社ミクシィが運営する日最大のソーシャルネットワーキングサービス(SNS)「mixi」において、2006年5月22日より開始された新サービス「mixiミュージック」専用のクライアントソフトウェア「mixi station」に有限会社グルコースの「glucose nano framework」が採用されました。 mixiミュージックは、ユーザーが視聴している音楽の楽曲情報を共有するサービスです。mixi stationは、ユーザーのPCにインストールされ、iTunesやWindows Media Playerで再生された楽曲情報をmixiミュージックに伝える役割を担います。 glucose nano frameworkは、PC上で行われる個人の活動とWeb上のサービスとをシームレスに結びつけるために開発されたクライアントソフトウェアです。WindowsおよびMacOS Xの両環境に対応

    teahut
    teahut 2007/07/02
    >glucose nano frameworkは、PC上で行われる個人の活動とWeb上のサービスとをシームレスに結びつけるために開発されたクライアントソフトウェアです。WindowsおよびMacOS Xの両環境に対応し、さまざまな動作形態に対応可能です。
  • mixiのあしあとAPI発掘 « ku

    mixiが新しく出したmixiステーションがすばらしいです。その裏側が。 mixiにログインした状態で http://mixi.jp/atom/tracks/r=2/member_id=myMixiID にアクセスするとatomで自分のページのあしあとがフィードされます。ちなみにmixiステーションが送っているリクエストは以下の通り。 GET /atom/tracks/r=2 HTTP/1.1 X-WSSE: UsernameToken Username="ku@example.com", PasswordDigest="passwordDigest8jrjEdO61Bx8c=", Nonce="Y0NonceLYj0=", Created="2007-06-29T03:04:30Z" User-Agent: mixi station/v1.4 (by glucose) Host: mix

    teahut
    teahut 2007/07/02
    >mixiにログインした状態で http://mixi.jp/atom/tracks/r=2/member_id=myMixiID にアクセスするとatomで自分のページのあしあとがフィードされます。ふつうにWSSE認証であしあとが取得できそうです
  • yohei-y:weblog: [これはすばらしい] mixi ステーション API。ただ一つ注文が…

    via: mixi あしあとAPI発掘 mixi が Atom Publishing Protocl (APP) 対応の Web API を mixi ステーションで利用しているそうだ。 さっそく手元にあった APP クライアントで試してみると 30分くらいであっさりと接続成功。当に素晴しい。 ざっくりと Web API を見させてもらったのだけれど、 拡張タグの使い方などセンスが良いし、さすがという感じだ。 ただ一点だけ、どうしても直してほしいのは APP の service document の名前空間 URI。 これは http://www.w3.org/2007/app が番仕様である。mixi の Web API は古い名前空間を使ってる。 中の人はわかっていると思うんだけど、APP はもう少しで RFC になる。 APP を実装する人は必ず RFC になる名前空間 URI

    teahut
    teahut 2007/07/01
    >APP の service document の名前空間 URI。これは http://www.w3.org/2007/app が本番仕様である。mixi の Web API は古い名前空間を使ってる。
  • 1