タグ

informationに関するtwainyのブックマーク (2)

  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • fladdict.net blog: 情報可視化のバイブル Visualizing Data

    Visualizing Data 最近は「見える化」っていうんですかね、著者のBen Fryはprocessingの生みの親にして、多量情報のビジュアライズを専門にするMITの研究者。 有名なところだとAnemoneとValenceなのかな。 同書は情報の可視化から、その理論、使いどころ、アルゴリズムからソースコードまで色々列挙されたナイスな。まぁ英語だけどパラパラ見て絵が気に入ったらソースコード読むで色々勉強になりそう。 あとBen Fryの論文読みたければ、「情報デザイン―分かりやすさの設計」 というに和訳が入っててお勧め。こちらもかなり名著というかマストな一品。 自分的にはiknowよりこういう読む方が英語の勉強になる気がするYO

  • 1