Stanford大学の自然言語処理講義(1-5) – Word Normalization and Stemming(単語の正規化と語幹抽出) | Synergy Marketing LAB BLOG
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Stanford大学の自然言語処理講義(1-5) – Word Normalization and Stemming(単語の正規化と語幹抽出) | Synergy Marketing LAB BLOG
記事へのコメント2件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Stanford大学の自然言語処理講義(1-5) – Word Normalization and Stemming(単語の正規化と語幹抽出) | Synergy Marketing LAB BLOG
久保です。 自然言語処理のStanford大学の講座シリーズの続きです。 前回はWord Tokenazionをやりました... 久保です。 自然言語処理のStanford大学の講座シリーズの続きです。 前回はWord Tokenazionをやりました。 今回は『Word Normalization and Stemming』、単語の正規化(Normalization)と語幹化(Stemming)です。 講義の映像は下記から見られます。 Word Normalization and Stemming (11:47) Normalization 例えば情報検索(IR)においては、インデクシングされたものとクエリの単語が同じform(形式)である必要があるので、単語の正規化が必要になります。 今「USA」と「U.S.A」を考えてみると、対応の仕方として U.S.Aのピリオドを削除する 検索の単語を展開する(window -> window, windows) という方法があります。 Case folding 情報
2016/01/18 リンク