タグ

2010年2月18日のブックマーク (7件)

  • 第8回 転置索引における検索処理 | gihyo.jp

    代表的な関連度指標には、コサイン類似度(cosine similarity)やOkapi BM25などがあります。具体的な計算式や詳細はここでは省略しますが、上記の値を組み合わせて、関連度を計算します[3]⁠。 コサイン類似度は、文書とクエリをタームを次元としたベクトル空間にマップし、文書ベクトルとクエリベクトルの成す角度により、文書とクエリの関連度(類似度)を求めます(成す角度が小さければ関連度が高い⁠)⁠。またOkapi BM25は、文書がクエリに対して適合かどうかは確率的に決定されるという統計的な原理に基づき、文書とクエリの関連度を求めます。 検索時にこれらを計算するには、索引の構築時に上記の統計値を計算し保持しておく必要があります。実装にはさまざまな方法が考えられますが、たとえばfd,tはポスティングリストの中に埋め込んでおき[4]⁠、ftやFtは辞書と一緒に保存しておくといった方

    第8回 転置索引における検索処理 | gihyo.jp
  • scalaのWebフレームワーク liftで遊ぶ 目次 - ( ꒪⌓꒪) ゆるよろ日記

    このエントリは scalaとか全然知らないjavaプログラマが、scalaのWebフレームワークliftで簡単なアプリケーションを構築するまでの過程をまとめたものです。 続きものです。全何回になるかはわからないけど、公式サイトのドキュメントに書いてある内容を実際に動かした後、 何らかのアプリケーションを実装するとこまでできればいいなぁと思います。 使用するliftのバージョンは、2008年8月8日現在で最新であるlift-webkit-0.9です。 目次 この目次はエントリが追加されたら更新します。 チュートリアル チュートリアル的な内容です。公式サイトのサンプルコードを動かしてみます。 scalaのWebフレームワーク liftで遊ぶ(1) - liftってなんなの?javaなの? - ゆろよろ日記 scalaのWebフレームワーク liftで遊ぶ(2) - インストール - ゆろよろ日

    scalaのWebフレームワーク liftで遊ぶ 目次 - ( ꒪⌓꒪) ゆるよろ日記
  • 世の中にはSとNの二種類の人がいる - My Life After MIT Sloan

    SとMとか、そういう話じゃないです。残念ながら。 ちなみに私はエ・・・。いや、なんでもないです。 あと磁石とかじゃないよ。 このSとNというのは、MBTI(Myers-Briggs Type Indicator)というタイプわけで使われる分け方。 (後注参照) 一言で言うと、S(Sensational:直観的)が事実から積み上げでモノを考える人のことで、 N(Intuitive:直感的)が結論や仮説からモノを考える人。 で、Sの人とNの人は、モノを考えるときに重視するものが全然違う。 仕事をしていて、相手が現実や事実を軽視するのでいらっとすることはないだろうか? 細かいところを相手がいつも見落とすので、何で見落とすのか分からなかったり。 あるいは相手が仮説やアナロジーばかり言うので、何を言いたいのかさっぱり分からない、という経験はないだろうか? 逆に、相手が事実や数字ばかり並べて、「要は何

  • Data Serialization + RPC with Avro & Ruby - igvita.com

    By Ilya Grigorik on February 16, 2010 Any programmer or project worth their salt needs to invent their own serialization, and if they are serious, an RPC framework - or, at least, that is what it seems like. Between, Protocol Buffers, Thrift, BERT, BSON, or even plain JSON, there is no shortage of choices and architectural decisions packed into each one. For that reason, when Doug Cutting (one of

  • ウープスデザインブログ

    トレンドに振り回されない。デザインの考え方を等身大にまとめたを書きました。 手書きPOPをIllustratorでつくろう!〜POPができるまで〜 Twitterで就職、テレビ出演、出版、セミナーできた自分がしてきたソーシャルメディアで意識していることを書いてみる 基の基!綺麗なデータの作り方:ロゴ編 タイポグラフィが苦手な人におすすめしたい私のやり方 高円寺コワーキングスペース「こけむさズ」始動 建築再構企画 ロゴマークデザイン 「あの記事も残しておいて欲しい」などがあれば教えてください。気が向けばサルベージします。

  • FriendFeedにおけるMySQLへの大規模データ格納 - masayang's diary

    RDBだのKey-Valueだのと騒がしい今日この頃ですが皆様いかがお過ごしでしょうか。私は元気です。先日、ベイエリアクラウド勉強会で教えてもらったHow FriendFeed uses MySQL to store schema-less data(FriendFeed流・スキーマレスデータのMySQLへの格納)を適当に翻訳してみますよ。(原文はCreative Commonsライセンス) 背景 FriendFeedではすべてのデータをMySQLに格納している。利用者の増加に伴い、FriendFeedのデータベースも拡大してきた。現時点では2億5000万件以上の記事が登録されており、これにコメントやお友達一覧のお気に入りなどのデータが加わる。 データベースの急成長に伴ない、規模に関する課題にも段階的に対処してきた。基的な対処はおこなってきたつもりだ。具体的には、読み取り専用スレーブの

    FriendFeedにおけるMySQLへの大規模データ格納 - masayang's diary
  • scheme-complete.el を auto-complete.el で使う - 【はてな】ガットポンポコ

    Schemeのシンボルを補完入力してくれる、scheme-complete.elを使い始めました。 ソースコードの記述の違いを見て処理系を自動的に判断してくれるみたいです。 scheme-complete.el の用意してくれる補完バッファが、なぜかうまく動作しなかったので、auto-complete.el で使えるようにしました。 scheme-complete.elをインストールsynthcode - scheme-completeから最新のscheme-complete.elをダウンロードします。 解凍して、ロードパスの通ったところに置きます。 gunzip -c scheme-complete-0.8.9.el.gz > scheme-complete.el mv scheme-complete.el /usr/share/emacs/site-lisp/ 設定(scheme-co

    scheme-complete.el を auto-complete.el で使う - 【はてな】ガットポンポコ