タグ

WikipediaとNLPに関するKshi_Kshiのブックマーク (3)

  • シソーラス - Wikipedia

    シソーラス (英: thesaurus) は単語の上位 / 下位関係、部分 / 全体関係、同義関係、類義関係などによって単語を分類し、体系づけた類語辞典・辞書。 語源はギリシャ語"thesauros"で、宝物庫の意味。1852年、英国でピーター・マーク・ロジェが、語彙を意味によって分類した『Thesaurus of English Words and Phrases』(英語語句宝典、1852)を著してから100年以上続いている。日では1964年、国立国語研究所が編集し『分類語彙表』を発表している。 シソーラスは類語辞典の一種である。類語辞典には五十音順に項目立てしているものと、概念ごとに分類しているものがある。シソーラスは語彙の持つ意味から、大分類 - 中分類と下っていき、目的の単語に達することができるようになっている。 シソーラスは自然言語処理の分野でも重要な位置にあり、『分類語彙表』

    Kshi_Kshi
    Kshi_Kshi 2012/11/21
    日本語シソーラスの代表的なものがまとめられている
  • [NLP] 日本語WikipediaからSolr用の類義語辞書を自動作成する - 株式会社ロンウイット

    Wikipediaなどの「辞書型コーパス」からLucene/Solr用の類義語辞書を自動作成するシステムを開発しましたので、簡単にご紹介します。 参考資料(SlideShare) 辞書型コーパスからの類義語知識の自動獲得(SlideShare) Lucene/Solrと類義語検索 Lucene/SolrではSynonymFilterを使って類義語検索を簡単に実現することができます。たとえば次のような内容のsynonyms.txtを用意し: 自動車損害賠償責任保険, 自賠責保険 Solrのschema.xmlファイルに次のようなフィールド型を定義すれば: <fieldType name="text_ja" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="solr.Japane

    [NLP] 日本語WikipediaからSolr用の類義語辞書を自動作成する - 株式会社ロンウイット
    Kshi_Kshi
    Kshi_Kshi 2012/11/20
    類義語辞書構築方法 / 名詞
  • Cara Cantik – Web Portal Model Makeup Terkini

    It seems we can’t find what you’re looking for. Perhaps searching can help. Search for: Search

  • 1