エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【python】nltkで英語のStemmingとLemmatization - 静かなる名辞
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【python】nltkで英語のStemmingとLemmatization - 静かなる名辞
Stemming(ステミング)は単語の語幹を取り出したいとき、Lemmatization(レンマ化、敢えてカタカナ表記... Stemming(ステミング)は単語の語幹を取り出したいとき、Lemmatization(レンマ化、敢えてカタカナ表記するとレンマタイゼーション)はカテゴリごとにグルーピングしたりしたいときに使う。 公式ドキュメントはここ。 nltk.stem package — NLTK 3.4 documentation 目次 Stemming 概要 Porterを使う Lancasterを使ってみる Lemmatizing 結論 スポンサーリンク Stemming 概要 nltkでStemmingに使えるクラスはたくさんある(ように見える)。nltk.stemに実装されているものだけでも、 ARLSTem Arabic Stemmer*1 アラビア語用 ISRI Arabic Stemmer*2 アラビア語用 Lancaster Stemmer*3 英語用。古い(1990年) Porter Stem