精度95%以上! ソースコードは指紋、作者はほぼ特定できる2015.02.11 19:0010,571 ほぼドンピシャでバレバレです。 スペースやタブ、大文字やアンダーバーを組み合わせた命名規則、コメント…コードの書き方には、人によってスタイルがありますよね。それはもう指紋のようなもので、それさえ見えれば、誰がコードを書いたかほとんどわかってしまう…そんな驚きの研究結果が発表されました。 米ドレクセル大学、メリーランド大学、プリンストン大学、独ゲッティンゲン大学の共同チームの研究によると、自然言語処理と機械学習によるコード分析により、95%の精度で作者は特定できるそうです。 解析されるのは、レイアウトや語彙の特性と、「抽象構文木(AST)」です。ASTとは、「コードの書き方からまったく影響を受けずに、コードの型の特性をとらえる」もので、つまり、関数の名前、コメント、スペース入れ方などのクセ
![精度95%以上! ソースコードは指紋、作者はほぼ特定できる](https://cdn-ak-scissors.b.st-hatena.com/image/square/9960c703d78d59f9387f0aa783f0b0242cd23081/height=288;version=1;width=512/https%3A%2F%2Fmedia.loom-app.com%2Fgizmodo%2Fdist%2Fimages%2F2015%2F01%2F150130coding.jpg%3Fw%3D1280%26h%3D630%26f%3Djpg)