タグ

2015年6月13日のブックマーク (1件)

  • あらゆる単語や文字列を正しく認識するための技術とデータについて - YAPC::Asia Tokyo 2014

    How to build the neologism dictionary for Japanese natural language processing 月に数回更新している OSS な MeCab の新語・固有表現辞書の詳細、使用例について言及します。また、日語自然言語処理の発展(例 : SF 映画の様にロボットの発するジョークで人間が豊かな気持ちになる未来)のために必要なデータの内容や形式、希望する公開方法についてお話します。 長い文 単語や文字列を正しく読める・認識できることは、ネットを介して人と人が円滑に交流するために必須です。 それをコンピュータができる様にすることは、人間の言葉を電子テキスト化した情報を活用して便利な世の中を実現するためにも大切です。 例えば、検索エンジンの様々な機能や、ニュースアプリケーションのニュース記事の自動カテゴリ分類などは、コンピュータが単語や

    あらゆる単語や文字列を正しく認識するための技術とデータについて - YAPC::Asia Tokyo 2014
    overlast
    overlast 2015/06/13
    NEologd をより早く充実させるために、みなさまにしかできないアクションについても話します。