タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

自然言語処理に関するkyohei_hamadaのブックマーク (3)

  • Python による日本語自然言語処理

    はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日語を対象とする場合、いくつか気をつけなければいけない点があります。日語を扱う場合にも

    kyohei_hamada
    kyohei_hamada 2011/08/28
    これはすごい、見やすいし、嬉しい。
  • Pythonによる日本語自然言語処理 #pyconjp

    Pythonによる日語自然言語処理 #pyconjp - Presentation Transcript Python   @nokuno   #pyconjp •  Python  2.X  •   •   •   •    •  @nokuno  /  id:nokuno  •  #TokyoNLP  •  Social  IME  /    StaKK  •  Web  •      Python  2.X   Python  2.X  /   read   write   UTF-­‐8   “ ” decode encode Unicode   u” ”    #  encoding:  utf-­‐8   u”  “   decode encode         MeCab•  MeCab•  Python MeCab   –  mecab ipadic,  mecab-­

    kyohei_hamada
    kyohei_hamada 2011/08/28
    @nokuno さんの記事。自然言語処理興味あるなー少し落ち着いたら Python を触りたい。
  • 自然言語処理勉強会で「ナイーブベイズによる言語判定」を発表してきました - 木曜不足

    第2回自然言語処理勉強会@東京 にのこのこ行ってきました。 ありがとうございました&お疲れ様でした>各位。 今回も全然専門じゃあないのに「ナイーブベイズで言語判定」というタイトルで発表してきた。 ナイーブベイズによる言語判定 from Shuyo Nakatani 内容は、仕事で作った(←ここ重要)言語判定ライブラリの紹介。 前回の「文抽出 using CRF」は検証プロトタイプであったわけだが、今回はオープンソースとして公開&最終的に製品に組み込むことを目標とした代物なので、「なんか良さげな感じ〜」だと駄目。目指すのは 50言語、99.うん%。 精度を上げるためにやれることならなんでもやる、というのがミッションなので、限りなく泥臭いことの積み重ねになる。 というわけでここ2ヶ月の積み重ねを資料にしてみたら、なんか膨大になってきて、また今回もしゃべりすぎてしまった(汗 楽しんでいただけた

    自然言語処理勉強会で「ナイーブベイズによる言語判定」を発表してきました - 木曜不足
  • 1