タグ

形態素解析に関するmytechnoteのブックマーク (1)

  • 文章からダジャレのみを抜き出すコマンドを作ってみた - Qiita

    kagomeを使うと、こんな感じで文章が分解され、「読み」や「品詞」が分かります。 ②文中に名詞と同じ「読み」が登場する回数を調べる kagomeで「読み」や「品詞」が分かったので、文章の中にある名詞と同じ「読み」が何回登場するか数えます。 例えば、 が寝転んだ という文章は ネコガネコロンダ という読みになります。 そして「が寝転んだ」という文の中には「」という名詞が含まれていますので、「ネコガネコロンダ」の中に「ネコ」が2回登場することが分かります。 ③文中に名詞と同じ「単語」が登場する回数を調べる もう②だけでダジャレ検出ができるようになった気になっていませんか? 実はこのままでは欠陥があります。 人民の人民による人民のための政治箱に入れる がダジャレ扱いされてしまいます。 こんなものダジャレとは言えません。ダジャレをなめてます。 この程度の重複で「今ダジャレ言った

    文章からダジャレのみを抜き出すコマンドを作ってみた - Qiita
  • 1