カテゴリ別不満特徴語辞書(旧・不満カテゴリ辞書データ) 国立情報学研究所が株式会社Insight Techから提供を受けて研究者に提供しているデータセットです。 2017/11/22 更新 データ概要 「不満買取センター」に2015年3月18日(サービス開始日)から2017年8月1日までに投稿されたデータのうち,特定カテゴリ下に投稿された約472万件より作成された,カテゴリごとに特徴的な単語を抽出した辞書データです。 本データに含まれるのは「カテゴリ」「単語」「単語の品詞情報」「単語のカテゴリ所属スコア」だけであり,特定の個人につながる情報は一切含まれていません。 提供するカテゴリは不満買取センターで運用されているカテゴリおよびサブカテゴリで,総務省の「日本標準産業分類」を参考に株式会社Insight Techがカスタマイズした体系であり,約190万単語について,TF-IDF,PMI(自己