タグ

検索エンジンに関するhachir0のブックマーク (2)

  • 新刊『検索システム ― 実務者のための開発改善ガイドブック』のお知らせ

    ご来店ありがとうございます。 2022年5月刊行の新刊『検索システム ― 実務者のための開発改善ガイドブック』(打田智子・古澤智裕・大谷 純・加藤 遼・鈴木翔吾・河野晋策 共著)のお知らせです。(リンク先は「PDFのみ」バージョンです。紙書籍とPDFのお得なセットも購入可能です) Webではおなじみの検索機能、いざ自分たちで導入しようと思ったとき、何から手を付けるでしょうか? とりあえず「全文検索エンジン」のようなキーワードでWebを検索しながら、LuceneやVespaでプロトタイプを作ってみる、という方も少なくないはずです。その過程では、チュートリアルだけで理解できない概念について再びWebで検索してみたり、「〇〇を実現するコードはどう書くんだろう」と思ってやっぱりWebで検索してみたり、そこで見つけた説明でわからないことをまた検索してみたり、とにかく何度も何度もいろいろな検索を繰り返

    新刊『検索システム ― 実務者のための開発改善ガイドブック』のお知らせ
  • 英語論文執筆のために arXiv からの例文検索サービスを作った話

    arXiv の論文から例文を検索する Hyper Collocation というサービスを公開しました. 以下はあまり整理されていない製作の記録です. 英語論文執筆用の例文検索サービス 英語での論文執筆の際に,専門用語を含む例文や言い回しのパターンを知りたいことが多々あります.有用なサービスとしては ライフサイエンス辞書のコーパス検索 Springer Exemplar (2018/2/1頃に終了) がありますが, データがライフサイエンス系の論文に限られている(ライフサイエンス辞書) ソートの基準が頻度順ではないため典型的な例文が上位にこない ストップワードに近い頻出語を検索した際の 検索が重い(Springer Exemplar) 表示可能な検索結果が偏る(ライフサイエンス辞書) という不満点があったので,並行して個人的な資料から検索を行うプログラムを作って使っていました. しかし,個

    英語論文執筆のために arXiv からの例文検索サービスを作った話
  • 1