タグ

ブックマーク / blog.stanaka.org (2)

  • Windows Azureも選択肢に入れてもよいかも、という話 - stanaka's blog

    先日のエントリで書いた通り、最近はAmazon EC2を格的に使うために色々試しているところです。Amazon EC2でのノウハウも溜りつつあり、世の中的にも事例が徐々に出てきていますが、すこし前に26台まとめて吹き飛ぶといった、クラウドのデメリットも徐々に表に出てきつつあります。 この手のデメリットはクラウドを使う以上は質的に避けがたいのですが、その時のためにもAmazonの奮起に期待するとか、なんとかバッドノウハウでカバーする、というだけではなく、そもそも別のクラウド事業者をいざという時の選択肢として確保しておきたいところです。 選択肢となりえるクラウドサービスは、国内でもいくつか登場してきていますが、今回は、ちょっと伏兵的なWindows Azureの可能性を試してみました。(Google App Engineは、さすがに環境が特殊すぎるので過去の資産がある立場としては、選択する

    Windows Azureも選択肢に入れてもよいかも、という話 - stanaka's blog
  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • 1