2017年10月1日のブックマーク (1件)

  • TechCrunch JP のタイトルから hiwa 氏の翻訳か否かを深層学習で推定する

    追記 (9月30日 22:00) Q : 文も用いると更に良いのではないか A : 可能な限り氏が翻訳した記事を開きたくないため、タイトルだけを用いた Q : 深層学習ではない手法との比較がない A : 追加実験を行った。登場する語彙の上位 12,000 個の bag-of-words を用いたところ RandomForest (class_weight = 'balanced', n_estimators = 500) では精度 0.93 , 再現率 0.66, f値 0.78 LinearSVC (sklearn のデフォルトパラメタ) では精度 0.88, 再現率 0.81, f値 0.84 となり、深層学習とあまり差がないことがわかった。 Q : 理由は何か 単語の頻度足切りを変化させても精度が変わらないことから、特定の語に強く反応している可能性がある。または特定ジャンルの記事が

    TechCrunch JP のタイトルから hiwa 氏の翻訳か否かを深層学習で推定する
    blzbb
    blzbb 2017/10/01
    有能。TechCrunchの記事は、まず最下部の署名欄を確認してhiwa訳だったら本文読まずに閉じることにしてるので、こうした研究はとても有意義。応援したい。というか、編集部はまともな日本語書けないライター雇うなよな。