タグ

ブックマーク / corepon.com (1)

  • 日本語セマンティクス - [2]夢のような分析を可能に

    マルチ回答の形式をとりましたが、これは定量データです。ですから、きちんとデータ処理できる(データマイニング)人なら、メーカーの因子分析は、このように明瞭な形で出るはずです。第五因子のトヨタ対ホンダの対決構造は「うーん」とうならされるものでした。現にトヨタを買いたいと挙げる人はホンダを絶対にリストアップしない。逆にホンダを買いたいという人も絶対にトヨタの名前を書かない、見事なまでの対比ぶりでした。 買いたい理由を記述した文章データは、統計学的には定性データといいます。 この解読の試みをテキストマイニングと称している集団がいますが、その内容は現状では噴飯(フンパン)ものレベルです。コトバを単語単位でぶち切って、ただあちこちに並べただけ状態に、相互に線で結んだりする冗談のようなものです。説明力はゼロに限りなく近いヘナヘナ水準。それに単語の数を多い順に書いて、例えば「乗る:ラ行5段活用」とか中学生

  • 1