ブックマーク / www.rondhuit.com (2)

  • apache-opennlp-1-9-0-ja-ner.html

    Apache OpenNLP を知ってますか。Apache OpenNLP(以下単に OpenNLP と記します)はその名の通り Apache Lucene/Solr と同じように Apache Software Foundation のもとで管理されているオープンソース製品で、自然言語処理のためのツールセットです。 自然言語処理(英語で Natural Language Processing;NLP と略記される)とは、日語や英語などの自然言語で書かれたテキストを処理するための技術の総称です。文書要約、機械翻訳、形態素解析、構文解析などなどいろいろな NLP のタスクがあります。記事では OpenNLP の一機能である固有表現抽出について説明します。 固有表現抽出とは 日語などの自然言語で書かれたテキストには人名、地名、組織名などの固有名詞が含まれています。これらの固有名詞を属性(

    gengohouse
    gengohouse 2020/07/25
    “最新 Apache OpenNLP 1.9.0 で日本語固有表現抽出を試す”
  • 言語処理学会第24回年次大会(NLP2018) のワークショップに参加しました - 株式会社ロンウイット

    著者:西潟 一生 2018年3月16日 に行われた 言語処理学会第24回年次大会 のワークショップに参加してきました。 言語処理学会の年次大会は NLP 関係者が年に一度集い,各研究成果を発表する場です。現在ロンウイットは学会での活動は行なってはいませんが,学会における研究成果には常に注目しています。 今回は岡山県での開催でしたので,最終日のワークショップのみ参加(聴講)してきました。ワークショップの詳細についてはリンクを参照して下さい。 参加したワークのショップのテーマは「形態素解析の今とこれから」です。丸1日を使って形態素解析についてディスカッションを行うという非常に稀な場でしたが,形態素解析についての現状を知ることができ,大変有意義だったかと思います。 午前中は以下の形態素解析器及びそれらに使用される辞書の開発者がそれぞれ現状を報告して下さいました。午後の招待講演も合わせ,内容をそ

  • 1