タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

wikipediaとSolrに関するwlbhiroのブックマーク (2)

  • WikipediaからのSolr用類義語辞書の自動生成

    6. 見出し語(=原型語) 類義語(=略語、日語版頭字語) 入国管理局 入管 文房具 文具 社員堂 社 国際連盟 国連 リポビタンD リポD ベルサイユのばら ベルばら 木村拓哉 キムタク Universal Serial Bus USB (日語における頭字語の例) Copyright (c) 2012 RONDHUIT Co.,Ltd. 6 7. 辞書型コーパス (見出し語,説明)× M 項目 設定ファイル <類義語知識の獲得> すべての見出し語に関し以下を ループ処理 Lucene/Solr インデックス 1. 類義語候補tBの同定 インデックス作成 2. 見出し語tAと類義語候補tBの 類似度S(tA, tB)の計算 3. 類似ならば出力 • • • 説見見 明出出 しし 語語 の 読 CSVファイル み Copyright (c) 2012 RONDHUIT Co.,Ltd

    WikipediaからのSolr用類義語辞書の自動生成
    wlbhiro
    wlbhiro 2015/05/19
    wikipediaからの同義語辞書作成方法
  • SolrにWikipediaのデータを入れて遊ぶ

    概要 全文検索エンジンのSolrを使って、Wikipedia(日語版)の記事を検索する機能をさらっと作ってみる。面倒なことはすっ飛ばして、できるだけ少ない手数を選択。あと、ソースコードはJava。 注意事項として、Solrはけっこうメモリう。特にoptimize時とか、大掛かりなソート時とか。 メモリが少ないマシンでは使うと不自由するので避けた方が良いかもしれない。とりあえず手元の4G積んだマシンでは快適に動いている。 @CretedDate 2011/09/04 @Env Solr3.5.0 / lucene-gosen1.2.1 @UpdateDate 2012/02/21 Solr3.5.0に変更したりクエリの誤りを直したり Solrの導入 まずSolrをダウンロードして解凍する。 ここからダウンロード http://lucene.apache.org/solr/#getstar

    wlbhiro
    wlbhiro 2015/05/13
    Solrにwikipediaのデータを投入する方法。
  • 1