タグ

ブックマーク / qiita.com/mosuka (2)

  • Rust初心者がRust製の日本語形態素解析器の開発を引き継いでみた - Qiita

    Rust初心者がRustで全文検索サーバを作ってみたの続きです。 この記事では、Rust製の日形態素解析器の開発を引き継いだ経緯と、その使い方を簡単に紹介します。 開発を引き継ぐことになった経緯 冒頭でも書きましたが、Rust初心者がRustで全文検索サーバを作っています。全文検索サーバを作り始めると、日人なのでどうしても日語のドキュメントをインデックスして検索したくなります。日語を上手く検索インデックスに登録するには日形態素解析器を利用するのが一般的です。 日形態素解析器、どれを使おうかな?とユーザの立場でいたのが、いつの間にか開発を引き継ぐことになりました。 日形態素解析器といえば、大御所のMeCabがあります。歴史も長く、PythonRubyJavaからMeCabを利用するためのバインディングも用意されています。 OSSの検索エンジンの世界ではLucene/

    Rust初心者がRust製の日本語形態素解析器の開発を引き継いでみた - Qiita
    tinsep19
    tinsep19 2020/02/27
  • Rust初心者がRustで全文検索サーバを作ってみた - Qiita

    情報検索・検索エンジン Advent Calendar 2019 の5日目の記事です。このAdvent Calendarを作った@takuya_aさんより、お誘いいただきました。 @minoru_osuka もし余裕あれば12/5の記事お願いします! https://t.co/YIA9tIB4Gj — takuya-a (@takuya_b) December 1, 2019 ということで、仕事とは別で個人的に始めたプロジェクトについて紹介できたらと思います。 私自身はApache Solrを好んで利用しています。 ただ、最近のサーバサイドの技術の移り変わりや、新しい開発言語の登場など、取り巻く環境が変化してきています。それらの習得も踏まえ、使ったことのない開発言語を用いて軽量な全文検索サーバを作り始めるという内容です。 開発した経緯 インフラの変化 ここ数年でインフラは大きく変化しました

    Rust初心者がRustで全文検索サーバを作ってみた - Qiita
    tinsep19
    tinsep19 2019/12/05
  • 1