タグ

2026年3月1日のブックマーク (2件)

  • X のレコメンドアルゴリズムの実装を読む

    はじめに 2026年1月、X のレコメンドアルゴリズムが公開されました。 以前にも、(Twitter と呼ばれていた頃の)レコメンドアルゴリズム[1]が公開されていましたが、今回は現時点での最新版のロジックとなっています。 この記事では、公開されたコードを読んで以下の点について理解を深めようと思います。 X のレコメンドシステム全体のアーキテクチャ 候補生成とランキングの2段階構成の実装 Two-Tower モデルによる高速な候補検索の仕組み Grok-based Transformer を用いたランキングモデルの詳細 リアルタイム推論を実現するための工夫 概観 2-stage レコメンドシステムの構成をとっており、次のようになっています。 1st stage: 候補生成 以下の2つの経路からユーザが興味を持ちそうな候補アイテムを高速に絞り込む フォロー中のアカウントの投稿 (In-Net

    X のレコメンドアルゴリズムの実装を読む
    bootJP
    bootJP 2026/03/01
  • なぜGPUはリアルタイム処理に向かないのか - Ryuz's tech blog

    はじめに 久しく CUDA プログラミングもしていないなと思いつつ、久々に Wiki で RTX5090 などのスペック眺めてたら、凄いことになっているなと思ったので自分への備忘録も兼ねて記事にしておきます。 あと、あくまで当サイトがメインとするFPGAと比べて、GPUがリアルタイム処理に向かないというお話で、FPGAGPUよりリアルタイムに強いと言われる話を裏返して考えてみようというものです。 用途によってリアルタイムの定義も変わってきますし、GPUがデータセンターなどでの大量のデータプロセッシングで十分な応答性で高いパフォーマンスを出しているのもその通りです。 先日書いた「続・FPGAに対する誤解」や「なぜGPUは高性能なのか」を少し補完するものにもなるかと思います。 最近の NVIDIA RTX のスペック RTX4090 と RTX5090 のざっくりと重要な数字だけ拾って換算し

    なぜGPUはリアルタイム処理に向かないのか - Ryuz's tech blog
    bootJP
    bootJP 2026/03/01