精度95%以上! ソースコードは指紋、作者はほぼ特定できる2015.02.11 19:0010,571 ほぼドンピシャでバレバレです。 スペースやタブ、大文字やアンダーバーを組み合わせた命名規則、コメント…コードの書き方には、人によってスタイルがありますよね。それはもう指紋のようなもので、それさえ見えれば、誰がコードを書いたかほとんどわかってしまう…そんな驚きの研究結果が発表されました。 米ドレクセル大学、メリーランド大学、プリンストン大学、独ゲッティンゲン大学の共同チームの研究によると、自然言語処理と機械学習によるコード分析により、95%の精度で作者は特定できるそうです。 解析されるのは、レイアウトや語彙の特性と、「抽象構文木(AST)」です。ASTとは、「コードの書き方からまったく影響を受けずに、コードの型の特性をとらえる」もので、つまり、関数の名前、コメント、スペース入れ方などのクセ
こんな記事がはてな匿名ダイアリーにありました。 娘が生まれて思ったこと(ブックマークページ) 地方在住の筆者が子供が生まれて、出産から大学卒業ぐらいまでに子供にかかる費用を皮算用するというものです。ブックマーク数が700ぐらいで話題になっている記事なんですが、この記事について、色んなモヤモヤがあったようで、自分に三方向からモヤモヤ解説の依頼がありました。 ※画像は平成17年版 国民生活白書 一人の子どもにかける費用はおよそ1,300万円より。ちょっと古いですけど参考になります。 三方向からの依頼 まずは、記事自体にモヤモヤしたというもの(たぶん)。これは、以前から自分のブログを読まれているid:yz_sさんからのものですね。 ブコメ見たらだいたい想像通りでしたのでトピシュさんおねがいします / 生み育てられる人はそうしてくれ、と思う。 / “娘が生まれて思ったこと” http://t.co
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く