
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
伝票明細内容をクラス分類したい時ってどうしてます? - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
伝票明細内容をクラス分類したい時ってどうしてます? - Qiita
はじめに 身近にはいろんな伝票があります。 データ分析を前提に、日付、品名などの種類、会社名等、属... はじめに 身近にはいろんな伝票があります。 データ分析を前提に、日付、品名などの種類、会社名等、属性分類されている伝票もあれば、「明細にわかるように書いておいて」というものもあります。 明細で内容を判断しなければならない伝票は、分類したり、集計したりするのは大変です。明細に書かれている内容は、句読点のある文章ではなく、注文番号、略称、現場しかわからないいわば記号であることが多いからです。 あるコンテンツ明細から「エンタメ」を抽出したいという場合、明細に書かれる内容は、「エンタメ、エンターテイメント、エンタ、エンタ、エンタメ、entertainment、Entertainment、娯楽…」等、大文字・小文字、カタカナ、英語、日本語、略称が入り混じっているかもしれません。 この例だけでも嫌になりますが、内容がイメージできる抽象語が書かれているものはまだマシなのかもしれません。 また、ペン、ノー