タグ

2021年10月7日のブックマーク (3件)

  • Indeed MPH:高速で小さいイミュータブルなキー・バリューストア - Indeed エンジニアリング・ブログ

    膨大なデータを抱えるアプリケーションをスケールする際に、どのようなストレージを導入するべきなのでしょうか?どうしたら大量のデータセットを安全に保存し、効率的に読み書きを行えるのでしょうか?こうした疑問は、よく SQL か NoSQL のどちらを使うべきかという議論になりがちですが、どちらもそれぞれメリットとデメリットがあります。 ですが、もしデータデースにまつわる問題を全て回避できる三番目の選択肢があるとしたらどうでしょうか? コンシューマは数分おきにしか更新を必要としていないかもしれません。この場合、データセットをメモリ内に読み込めると、劇的にアクセス速度があがり、大規模のスケールが可能になります。このことから、 Indeed では多くのプロジェクトで、必要なデータの完全なコピーを、各コンシューマに渡しているので、 SQL 対  NoSQL の議論をする必要がありません。これを実現するに

    Indeed MPH:高速で小さいイミュータブルなキー・バリューストア - Indeed エンジニアリング・ブログ
  • Perfect Hashing

    Initial hash returns (A,B), final hash is A^tab[B] The perfect hash algorithm I use isn't a Pearson hash. My perfect hash algorithm uses an initial hash to find a pair (A,B) for each keyword, then it generates a mapping table tab[] so that A^tab[B] (or A^scramble[tab[B]]) is unique for each keyword. tab[] is always a power of two. When tab[] has 4096 or more entries, scramble[] is used and tab[] h

  • 高品質のAI学習データなら|株式会社バオバブ

    バオバブが目指す社会 誰もがその人らしくいることが 受け入れられ、 人生の選択肢が 開かれている社会へ 私たちは、働くことに制限がある人も、そうでない人も、互いに違いを認め合い共助する文化を何よりも尊重しています。 働くことを通じて、「それぞれ1人ひとりが自己有用感を高く持ち、適正な対価を得られる環境と文化をつくること」、そして、「それぞれ異なる背景や事情を持っていても、誰もがプロフェッショナルとしてプロジェクトに向き合える仕組みを作り、人材を育成し続けること」を大切にしています。 それは自分で選択・決定し、自分で行動する人が社会に増えることが、不平・不満を家庭、パートナー、会社、地域、そして、国や国籍のせいにすることなく、誰もがみな幸せになることにつながると信じているからです。 1人ひとりがアノテーションのプロとして働くバオバブの文化と仕組みで、私たちは、世界最高品質のAI学習データを提

    高品質のAI学習データなら|株式会社バオバブ