2015年11月23日のブックマーク (2件)

  • ディープラーニングでおそ松さんの六つ子は見分けられるのか 〜実施編〜 - bohemia日記

    前回、おそ松さんたちをディープラーニングで見分けるため、準備編としておそ松さんたちの顔画像を5644枚集めました。 今回はそれを用いて、ディープラーニングで学習させ、判別器を作って検証します。 集めた画像 人物 枚数 例 おそ松 1126 から松 769 チョロ松 1047 一松 736 十四松 855 とど松 729 その他 383 使用フレームワーク 最近GoogleからTensorFlowという新しいディープラーニングのフレームワークが発表されました。 会社のブログに使い方書いたのですが、まだ慣れていないので、今回はchainerを使います。こちらだとすぐに高い成果を上げているImageNetのNINモデル、4層畳み込みニューラルネットワークがサンプルで入っていますので、こちらを改良して使います。 imageNetの使い方は、こちらやこちらを参考にしています。 訓練データセット Im

    ディープラーニングでおそ松さんの六つ子は見分けられるのか 〜実施編〜 - bohemia日記
  • 正例とラベル無しデータからの学習 (PU classification)

    追記(2016/07/22) sample weightingによるPUClassificationも実装しました – https://gist.github.com/nkt1546789/d4ffebb452fe738b8aaa8005fc08a068 任意の分類器を使えるのでこちらの方が良い気がします. 通常の2値分類問題では,正例と負例が与えられています. しかし扱う問題によっては,このようなデータを用意するのが困難な時があります. 例えば,抽出型のタスクです. 抽出型のタスクでは,抽出したい対象を正例と考えます. この場合の負例は「正例以外のデータ」と定義するほかありません. しかし,集めた正例に対し,それ以外のデータを負例と定義してしまうと, それ以外のデータに含まれる正例も負例として扱ってしまいます. このように負例を定義するのが難しい場合には,正例とラベルなしデータから学習す

    正例とラベル無しデータからの学習 (PU classification)