タグ

NLPに関するmktakuyaxのブックマーク (2)

  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • RSSからマルコフ連鎖で文章生成する(Python)

    マルコフ連鎖自体あんまり理解してないけど、とりあえず実際のソース読んで勉強しようかなーと思ってぐぐったら、一番上に出てきたページが繋がらなかったので、キャッシュからソースコードを拾ってそれをPythonに移植してちょっといじってみた。可変変数久しぶりに見た。 やってること 1) ニュースサイトのRSSを習得 2) そのなかからランダムにエントリーを選んでMeCabへつっこむ。 3) MeCabからの結果をマルコフ連鎖によりつなげて出力。 マルコフ連鎖についてはこのあたりとか読むといいかもしれない。 形態素解析についてはここを読んだ。実際にはMeCabにお任せですが。 # -*- coding: utf-8 -*- import MeCab import string import random import feedparser import re import sys # http://

    RSSからマルコフ連鎖で文章生成する(Python)
  • 1