タグ

2016年10月11日のブックマーク (8件)

  • 実タスクで能動学習を試してみた - yasuhisa's blog

    実タスクで簡単な能動学習を試してみました。結論としては、1200件で到達できる精度に400件程度のアノテーションでも到達でき、それによりアノテーションに要する時間をかなり削減できそうということが分かりました*1。今後、アノテーションを必要とする機械学習タスクをやる際には能動学習で一手間かけるのを検討してみようと思います。 能動学習をする動機 ここしばらく仕事のタスクで機械学習の教師用のデータをアノテーションをする機会がありました。機械学習する上で、1000件程度は学習データ欲しいという想定でポチポチとアノテーションをしていました。一人1時間で大体100件くらいのデータが作れるようなタスクでしたが、1000件アノテーションするには約10時間の作業工程が必要です。アノテーション自体よりはコードを書いたり実験するのが好きな人間なので、5時間くらいずっとアノテーションしていると疲労します。同じ精度

    実タスクで能動学習を試してみた - yasuhisa's blog
  • 宇宙人のアルファベット ~DCGAN×文字~ - Qiita

    ※昨年話題になったDCGANで遅ればせながら遊んでみたという話です。内容としてはアルファベットに適用しただけです。 背景 ドレイクの方程式のN値がもし1より大きければ、どこかに地球外文明があり、おそらく何らかの文字が使われていることでしょう。そしてその多くは、地球でも生まれた(そして消えていった)文字とかなり共通している、または似ている確率が高いと思います。 文字としての制約: - 条件1:少々くずれても互いに判別可能な(判別しやすい)文字のセットであること - 条件2:複雑すぎないこと - 条件3:描きやすいこと(≒条件2) を満たす図形のバリエーションには限りがあるためです。 であるならば例えば、現在のアルファベットから特徴を抜き出してうまくアルファベット様文字列生成器を作れれば、パラレルワールドのアルファベット、そして宇宙人のアルファベットを垣間見ることができるはずです。 実験手法と

    宇宙人のアルファベット ~DCGAN×文字~ - Qiita
  • Beginning Machine Learning with Keras and TensorFlow

    This isn’t our typical kind of blog post. In fact this one is very special. It’s the beginning of our journey with a new shiny toy. Every now and then there comes a field of technology that strikes us as being especially exciting. With all the latest accomplishments in the field of artificial intelligence it’s really hard not to get excited about AI. Companies such as Google, NVIDIA or Comma.ai ar

    Beginning Machine Learning with Keras and TensorFlow
  • GoogleのC++最適化ライブラリCeres Solverを使って制約付き最適化問題を解いてみる - MyEnigma

    はじめての最適化posted with カエレバ関口 良行 近代科学社 2014-02-05 Amazonで探す楽天市場で探すYahooショッピングで探す 目次 目次 はじめに 制約付き最適化 Ceres Solverで制約付き最適化問題を解く 参考資料 MyEnigma Supporters はじめに 今回もGoogleC++最適化ライブラリCeres Solverを使ってようという記事です。 (これまでの関連記事は末尾のリンクを参照下さい) 今回は、これまでは制約条件の無い最適化問題を解いてきましたが、 制約条件付きの最適化問題を解いてみようと思います。 制約付き最適化 制約付き最適化問題は、下記の記事で説明しているとおり、 パラメータに範囲などの条件が付いた最適化問題のことを指します。 myenigma.hatenablog.com 最適化技術を実際のシステムに利用場合、 最適化パ

    GoogleのC++最適化ライブラリCeres Solverを使って制約付き最適化問題を解いてみる - MyEnigma
  • GoogleTestでよく使う用法集

  • 僕が英語を話せるようになるために実践した勉強法

    僕は大学受験を経て、私立の社会学部に入学することになった。大学受験では第1、2志望とことごとく落ちて自信を失いつつあったのだが、 英語を話せるようになれば志望してた大学に入るよりもかっこいいではないか と、単純な動機で英語を学び始めた。 使える英語勉強法 僕が言った英語ができるとかっこいいというのは、「 使える英語 」を身につけることだった。 TOEICの勉強もそれなりにしたが、それが果たして役に立つものかわからなかったし、何よりその勉強が「使える英語」になるのかと不安だった。 どのように勉強すれば、「使える英語」を身につけることができるのだろう そんな悩みを抱えている人はたくさんいると思うし、実際僕もそうだった。当時の僕はTOEICも400点くらいしかとれなかったし、それ以上にリスニングが1問もわからないことにショックを受けていた。わからなすぎてテスト中のほとんどを睡眠に費やした。まし

    僕が英語を話せるようになるために実践した勉強法
  • Tsungで負荷テストしよう(1) - 基礎知識

    こんにちは。CTOの馬場です。 負荷テストツール Tsung の話です。 HTTP負荷テストツールだと JMeter や ab 、httperfあたりが有名ですね。 新しいところだとTsungやGatlingでしょうか。 私は去年くらいからTsungをよく使っているので紹介します。 このエントリは第1回です。 Tsungで負荷テストしよう(1) - 基礎知識 Tsungで負荷テストしよう(2) - 実践Tips Tsungで負荷テストしよう(3) - リアルな負荷のためのTips Tsung のお勧めポイント まずはTsungのお勧めポイントから。 負荷をかける側に必要なマシンスペックが低い 負荷をかけるとき、JMeterよりTsungのほうが同じサーバでより大きな負荷を生成することができます。 もちろん必要な負荷が1台で生成しきれない場合は複数台で連動して負荷を生成することができます。

    Tsungで負荷テストしよう(1) - 基礎知識
  • NNライブラリChainerをScikit-learn likeにガンガン拡張する

    APソリューショングループの大杉です。 SFCの修士2年の加藤慶之さんが、機械学習を中心としたデータ分析について勉強してみたいと言ってきたので、OJT的に3ヶ月間ほど一緒に仕事をさせてもらいました。 その中で機械学習ツールを共同開発したのですが、世間に公開できるレベルまで作りこむことが出来たのでリクルートテクノロジーズのgithubレポジトリでxchainerという名前で公開することとなりました。 このツールについて、加藤さんが記事を書いてくれたので、人の承諾のもと、ここにその記事も公開します。以下、加藤さんの記事です。 はじめに 近頃話題の、PFIが開発しているChainerというニューラルネットワークのライブラリはご存知の方も多いかと思います。ネットワーク構造の定義なども直観的に書くことができてとても素敵なライブラリなのですが、Scikit-learn1との互換性がないので予測率の評

    NNライブラリChainerをScikit-learn likeにガンガン拡張する