タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

日本語と文章に関するxenomaのブックマーク (1)

  • 文章の書き手の同定方法

    増田はてなの文句言ってるidを割り出した 文書の内容から同一人物の判定をすることは、まず無理です。それよりは筆跡鑑定的な手法を使うことをお奨めします。文章の記述法・書式から判断するということです。 「記述法・書式」とは、「どういう言葉を漢字に変換し、どういう言葉をひらがなで書いているか」とか、「どういう約物を好んで使っているか」とか、「どういうタイミングで改行をしているか」とかです。 こういう視点でもとの文章をみてみると、強烈な特徴があります。「ASCII文字と日語の文字の間に半角スペースを入れる」という特徴です。これは普段からそういう文章を書いている人間以外には決して現れない特徴です。しかも「Web標準」「geekたち」の箇所だけはスペースが入っていません。このへん、使っている仮名漢字変換の設定や使用方法の癖がでていて興味深いです。 また、「弄る」「誤摩化してます」「目を瞑る」など、

    文章の書き手の同定方法
  • 1