ストーリー by hylom 2015年01月30日 14時32分 コード品質判定システムなんかも作れるかも? 部門より Drexel Universityとthe University of Maryland、the University of Goettingen、Princetoの研究者らが、ソースコードを分析し、その記述スタイルからその著者を検出する「code stylometry」なるシステムを開発したそうだ(Slashdot)。 実験では著者が明らかになっているソースコードを自然言語処理や機械学習といった技術を使って分析・学習するシステムを開発。250人の著者、1人の著者当たり平均630行のコードを学習させたところ、95%の成功率で「匿名のコード」の著者を見つけられたという。 また、学習に使用したソースコードの著者数を30人に減らし、また1人あたりのソースコード量を1900行に