ブックマーク / ultraist.hatenablog.com (5)

  • Torch7で最近傍探索のベンチマーク - デー

    最近、Torch7で最近傍探索を繰り返し行いたかったけど、すごく遅いのでは??という不安があったのでk-NN(k=1)でベンチマークしてみた。 設定 MNISTをk-NN(k=1)で評価する 尺度はコサイン類似度とする テストを全件評価してかかった時間を計測する 環境 Intel(R) Core(TM) i7-3770K CPU @ 3.50GHz 32GB RAM GeForce GTX 760 パッと思いついた実装 初めは難しいことは考えず、パッと思いついた方法を試してみる。 工夫としては、 コサイン類似度を求める際にベクトルのノルムを毎回計算したくないので、最初にノルムが1になるように正規化しておく(内積=コサイン類似度になる) 各テストデータと各学習データの比較は、gemv(torch.mv)で一度に計算すれば速いのではないか require 'optim' require 'xl

    Torch7で最近傍探索のベンチマーク - デー
    elu_18
    elu_18 2016/05/12
    K近傍法はultraist氏のブログ記事を参考にCUDA(cutorch)を使ってやりました.K近傍法が遅くてつらいという人がフォーラムで散見されましたが,GPUを使えばすぐ終わります.|Torch7で最近傍探索のベンチマーク https://t.co/Q2oqlp
  • National Data Science Bowl 10位 - デー

    プランクトン画像分類コンペこと National Data Science Bowl が終わりました。 Description - National Data Science Bowl | Kaggle 結果はタイトル通り10位(1049チーム中)でした。賞金2000万円が1円も貰えなかったショックで毎日15時間くらい寝ています。感想と投稿内容です。 感想 世界Deep Convolutional Neural Networks職人コンテストという感じでした。みんな強かったです。前半は、2〜5位くらいにいる状態だったので、これは賞金はオレのものだなHAHAHAなどと思っていたのですが、終盤は15位くらいまで押し出されるようになり、こいつらマジかよ、強すぎだろ、と思って、最後方向転換をしてどうにか10位で終われました。自分の感覚ではスコア(NLL)で0.7以下を出せれば、Deep CNNを熟

    elu_18
    elu_18 2015/03/20
    日記です / National Data Science Bowl 10位 - デー http://t.co/kS8GMHWzsv http://t.co/1ZClt0ugbR
  • Torch7の分かりにくい話 - デー

    Facebookがtorchの拡張を公開したこともあり、torchを使ってみている方も出始めたようなので、自分がtorchで使う上で分かりにくかったことやハマったことなどを上げていきます。 ある程度使っている方を前提としています。 ひどいことをたくさん書きますが、torchが嫌いなわけではありません。torchはサイコーです。 リリースやバージョンについて ezinstallはgitのリポジトリをcloneしてインストールします。torchは今のところリリースの管理などしていなくて、日々更新される開発リポジトリがあるだけなので、インストールした日によって異なるバージョンがインストールされます。 たまに以下のようなコマンドを実行して更新したほうがいいです。 #!/bin/sh sudo luarocks install cwrap sudo luarocks install torch su

    Torch7の分かりにくい話 - デー
    elu_18
    elu_18 2015/01/31
    @dosei_sanga 順番を間違えると割とすぐ壊れるようですね.既にやってるかもしれませんが更新用のスクリプトと作っておくとよいそうです.| https://t.co/wsJA0gklbo
  • Kaggle CIFAR-10の話 - デー

    以前、Kaggle CIFAR-10 に参加していると書きましたが、これが2週間ほど前に終わりました。コンペはまだ Validating Final Results の状態なのですが、2週間たっても終わらず、いつ終わるのか謎なのと、多分結果は変わらないと思うので先に書きます。 CIFAR-10は、次のような32x32の小さな画像にネコ、犬、鳥など10種類の物体が写っているので、与えられた画像に何が写っているか当てる問題です。 (Kaggle CIFAR-10のデータセットは、通常のCIFAR-10と結果の互換性がありますが、チート防止に画像のハッシュ値が変わるように改変されているのと、テストセットに29万枚のジャンクイメージが含まれています。) 自分の結果は、0.9415 (正解率94.15%)で、Classification datasets results によると、state-of-

    Kaggle CIFAR-10の話 - デー
    elu_18
    elu_18 2014/11/08
    Kaggle CIFAR-10の話 - デー http://t.co/toLzihan1Y
  • CIFAR-10でstate of the artのスコアが出せる、インターネットに落ちている中で最強のコード - デー

    DecMeg2014をやっているときにCUDA使いて〜と思うことがあったので、最近、GTX760というGPUを購入して、Kaggle PlaygroundのCIFAR-10(有名な物体認識のデータセット)で試していたのですが、CIFAR-10のstate of the artである0.912を微妙に超える精度(0.9173)が出せるようになったのでソースコードを公開します。 nagadomi/kaggle-cifar10-torch7 · GitHub この結果は、"ベンチマークサイト Kaggle"で現在3位にランキングされています。 内容的には特に面白いことはしていなくて、cropping,scaling,horizontal reflectionで学習データを180万件(36x)まで増殖させたあとでNIN(Network In Network)というConvolutional Neu

    CIFAR-10でstate of the artのスコアが出せる、インターネットに落ちている中で最強のコード - デー
    elu_18
    elu_18 2014/11/08
  • 1