タグ

ブックマーク / blog.stanaka.org (2)

  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • stanaka's blog

    2022年振り返りというものを書いていたようで*1、はてなブログからリマインドが来たこともあり、2023年振り返りを書いてみる。 仕事 2023年の仕事は引き続きエンジニアチームのマネジメントが中心で、ハイライトとしてはコロナ渦以来できていなかったオフサイトをボストンで開催できたこと。いつも画面越しにしか見たことがなかった同僚たちとリアルで会うことができてよかった。一度会っておくと、その後の仕事もやりやすい気がする。あと海外でオフサイト企画に携わったのは初めてだったけれど、参加してもらった人達の満足度は高くできたようでよかった。また、普段は英語仕事をしているわけだけど、その英語はギリギリなんとかなっているレベルという自己評価をしていて、「ギリギリ」という状態から抜け出すためにも、主に発音をもうすこし良くしたい。 プライベート プライベートでは旅行に良く行った年となった。アメリカにいる間に

    stanaka's blog
  • 1