タグ

画像に関するakiramazのブックマーク (4)

  • 斜めに写った画像をCanvasで矩形に補正する - すぎゃーんメモ

    将棋駒画像分類の話の続きのような、あんまり関係もないような。 memo.sugyan.com memo.sugyan.com 結局、素材を組み合わせて自動で生成しただけの駒画像ではやはりデータが足りていないようで、「やはりもっと様々な画像から人力でラベル付けしてデータセットを作っていく必要がありそう」ということになった。 とはいえ、インターネットから画像を拾ってこようと思うと、例えば以下のような感じで (引用元: フリー写真素材ぱくたそ) 多少ならともかく 斜めの角度から写っているものは、そのまま矩形に切り出して学習用画像データに利用するのは難しそう。 これらはうまいこと変形して使いたい。 いわゆるperspective projectionの逆変換のような操作が必要になる。 JavaScriptを使ったCanvas APIでの変換では簡単な拡大・縮小などの変換は可能だけど こういったpe

    斜めに写った画像をCanvasで矩形に補正する - すぎゃーんメモ
  • Googleの画像認識APIを基に、好きな画像を学習させて認識機能を簡単にカスタマイズできる「Cloud AutoML Vision」発表 - Publickey

    Googleの画像認識APIを基に、好きな画像を学習させて認識機能を簡単にカスタマイズできる「Cloud AutoML Vision」発表 Googleは、Googleが提供する学習済み機械学習APIを基に、ユーザーが自分のデータを学習させることで認識機能をカスタマイズできる「Cloud AutoML」を発表しました。 「Cloud AutoML」に対応したAPIの第一弾として、ユーザーが独自の画像を学習させられる「Cloud AutoML Vision」を発表しました。 学習済みの機械学習APIに対して追加で学習可能 Googleは、機械学習を用いた画像認識APIとして「Cloud Vision API」を以前から提供しています。 Cloud Vision APIはあらかじめGoogleによって学習済みであるため、画像を読み込ませるだけで、人間の顔の検出やや犬といった動物、船や飛行機、

    Googleの画像認識APIを基に、好きな画像を学習させて認識機能を簡単にカスタマイズできる「Cloud AutoML Vision」発表 - Publickey
    akiramaz
    akiramaz 2018/01/18
    みんなでラベル付き画像をGoogle様に提供しよう!
  • GANによるノイズ・モザイク等の除去 - にほんごのれんしゅう

    GANによるノイズ・モザイク等の除去 近況 眠い。 実は今月、三回も停電が起きてそのたびに機械学習のモデルが飛んでいます。原因は電子レンジとケトルを両方利用したとか、そういった当たり前のことなのですが...(ブレーカを飛ばしているの私でないです)。 モチベーション pix2pixなどのニューラルネットでの画像変換は、通常のフィルタと違って、情報量を増加させることができるような振る舞いをすることがある。 画像は大学の学部で習ったレベルの知識しかないが、平滑化フィルタなどの画像を変換する系のやつは大抵が行列で表現されるようなやつで、平均値だの分散などを取るので、情報量が下がるものがほとんどだった(というかそれしか知らない)。 GANでモザイク除去や、なんやらができるとは先行研究でわかっていたし、理論は単純だし、この前のpix2pix with textに比べて簡単だと思った。 先行研究 GAN

    GANによるノイズ・モザイク等の除去 - にほんごのれんしゅう
  • 画像処理をするときに、iTermの画像表示機能が便利 - Qiita

    iTermの新しいバージョンには、ターミナル内に画像を表示できる機能がついている。 (公式ページの画像を転載) 画像処理などのプログラムを書くとき、ちょっとした変更を加えて実行するのを繰り返して何度も試行錯誤することが多い。そういうときに、iTermの画像表示コマンドを使うと高速にトライアンドエラーできて捗る。 たとえば、画像から顔認識するプログラムを書くとする。このとき、標準出力に画像バイナリを出力するようにしておく。 import cv2 import sys path = sys.argv[1] cascade_file = "/usr/local/Cellar/opencv/2.4.12_2/share/OpenCV/haarcascades/haarcascade_frontalface_alt.xml" image = cv2.imread(path) cascade = cv

    画像処理をするときに、iTermの画像表示機能が便利 - Qiita
    akiramaz
    akiramaz 2016/07/24
    たしかに便利だ
  • 1