エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
自然言語(前)処理 - Qiita
この記事は,NTTドコモSI部アドベントカレンダー5日目の記事になります。 新入社員の澤山です。業務では... この記事は,NTTドコモSI部アドベントカレンダー5日目の記事になります。 新入社員の澤山です。業務では自然言語処理に関わる内容に取り組んでいます。 5日目のこの記事では,自然言語処理の基本であるテキストデータの前処理について紹介します。 なぜ,前処理を行うのか? 私たちは日々,様々な文字や言葉に囲まれています。話し言葉,書き言葉,ネットスラング,外国語,プログラム言語,多種多様の記号といったものです。人間は,これらが混ざったテキストデータをある程度理解できますが,機械学習などでは,それらの分類や予測・理解が容易ではありません。 そのため,いかに分類モデルにこれらを理解しやすくさせるか(さらには,人間が理解・処理しやすくするか)が,前処理が必要な理由であり,前処理を行う理由だと考えています。 それでは,前処理をおこなうことのメリットを順番に見ていきしょう。 データ利用の容易性の向上 データ
2019/01/01 リンク