金明哲先生がご自身の"Jin's Page"で公開されているESTRELAのPDFですが、現在は「統計的にテキスト解析」というシリーズが刊行中です。現在は(Ⅰ)と(Ⅱ)がアップされていて、前者は計量文献学・コーパス言語学・テキストマイニングについての基礎知識で、後者は正規表現などを使ったテキスト処理入門。 あくまで初心者向けの記事ですが、それだけに自分の論文の冒頭部などで言及するのに便利かも。何と言っても、オンラインで無償公開されていることに大きな意味がある。(Ⅲ)の公開が非常に楽しみ。 ・統計的にテキスト解析 (Ⅰ) → http://www1.doshisha.ac.jp/~mjin/R/200803_56.pdf ・統計的にテキスト解析 (Ⅱ) → http://www1.doshisha.ac.jp/~mjin/R/200804_57.pdf