[B! DeepLearning][画像] slay-tのブックマーク

slay-t id:slay-t

DeepLearningと画像に関するslay-tのブックマーク (8)

似ているヘアカット写真を見つける画像認識AI　「Yahoo! BEAUTY」の新機能で活用
ヤフーは2月15日、ヘアスタイル検索サービス「Yahoo! BEAUTY」に独自の画像認識AIを使った新機能を導入したと発表した。ユーザーの好みに合うヘアスタイル画像の表示精度がアップしたという。入力した名称のヘアスタイル画像を表示するもの。従来は画像に付けられたハッシュタグを基準に類似画像を表示する仕組みだった。新機能ではAIがヘアスタイルの特徴と髪の毛の色を識別し、類似画像を表示する方式に変更。識別方法には画像認識で精度が高い学習手法とされる「Convolutional Neural Network」（CNN）を採用した。ヤフーによると、学習対象は「ショート」「セミロング」といった髪の長さ、「マッシュ」「ひし形」などの髪形のシルエット、「ワンカールパーマ」「外ハネ」のような毛先の動き、「クール」「ガーリー」といったヘアスタイルへの印象に至るものまで多岐にわたるという。類似画像
slay-t 2021/02/16
AI

画像

学習

写真

news

勉強

deeplearning

Deep Learning

技術

人工知能
リンク
メルアイコン変換器を作った話 - Qiita
はじめに「メルアイコン」と呼ばれる、Melvilleさんの描くアイコンはその独特な作風から大勢から人気を集めています。上はMelvilleさんのアイコンです。この方へアイコンの作成を依頼し、それをtwitterアイコンとしている人がとても多いことで知られています。代表的なメルアイコンの例（左から順にゆかたゆさん、みなぎさん、しゅんしゅんさんのものです (2020/12/1現在)）自分もこんな感じのメルアイコンが欲しい！！ということで機械学習でメルアイコン生成器を実装しました！！.......というのが前回の大まかなあらすじです。今回は別の手法を使って、キャラの画像をメルアイコンに変換するモデルを実装しました。例えばこんな感じで変換できます。実装したコードはこちら本記事ではこれに用いた手法を紹介していきます。 GANとは画像の変換にあたってはUGATITという手法を使って
slay-t 2020/12/02
学習

画像

qiita

勉強

map

機械学習

deeplearning

Deep Learning
リンク
なぜGoogle Meetの背景ぼかしが最強なのか（一般公開版）
はじめに最近ついに、Google Meet に背景ぼかし機能が利用可能になりましたよね。日本語だとインプレスのケータイ Watchの記事などで紹介されてます。確か 2020 年 9 月末前後で順次リリースされていたと記憶しています。このときは「背景ぼかし」の機能しかなかったのですが、最近（私が気づいたのは 2020/10/30）更にアップデートされました。アップデートで「背景差し替え」機能が付いて、ぼかし機能もぼかし効果が強弱 2 つから選べるようになりました。まだ日本語のニュース記事は見てないですが、Googleによるアップデートの発表はちゃんとされています。そして、Google AI Blog でBackground Features in Google Meet, Powered by Web MLという記事が公開され、実装についての解説がされました。この記事はその解説記事を
slay-t 2020/11/02
google

画像

ブラウザ

パフォーマンス

機械学習

programming

技術

deeplearning

machinelearning
リンク
深層学習系のトップ会議ICLR2020のNLP系論文についてざっくり紹介 - 株式会社ホクソエムのブログ
ホクソエムサポーターの白井です。今回はICLR2020 の論文を紹介します。 The International Conference on Learning Representations (ICLR) は機械学習の中でも特に深層学習を専門とした国際会議です。 OpenReview.net によるopen peer reviewを採用しているので、submitされた論文はだれでも閲覧可能です。(ICLR2020 open review) 2020年はエチオピアで開催予定でしたが、COVID-19の影響でvirtual conferenceとなりました。今回はNLP系の論文について5本紹介します。すでに日本語ブログ記事で紹介されているような論文もありますが、自分が興味を持った部分を中心としてざっくりと紹介したいと思います。以降、とくに記載がない場合、図は論文またはブログからの引用で
slay-t 2020/04/22
学習

言語

ブログ

画像

会社

https

github

NLP

deeplearning
リンク
【論文読み】新・オートエンコーダで異常検知 - Qiita
以前の記事でオートエンコーダによる異常検知は古い！と書いてしまいましたが、最近は進化しているようです。今回ご紹介する論文は、損失関数を工夫することで通常のオートエンコーダよりも異常検知能力を上げる手法です。 ※本稿の図は論文（Improving Unsupervised Defect Segmentation by Applying Structural Similarity To Autoencoders）より引用しています。論文の概要通常のオートエンコーダによる異常検知は、微小な異常は捉えられない。そこで、一枚の画像に対し小さな枠を用意して「輝度」、「コントラスト」、「構造情報」の類似度を計算して異常検知を行う。本手法を使うことで、通常のオートエンコーダやVAEの異常検知と比べて、AUCで大幅な向上が見られた。異常部分の可視化についても、通常のオートエンコーダよりも優れ
slay-t 2019/09/09
画像

qiita

machinelearning

異常検知

deeplearning
リンク
【Deep Learning入門】0から勉強して3ヶ月でポリープ検出AIをつくったった - Qiita
３ヶ月で出来たものまずは蠢く内臓の成果物から、これが今回作ったポリープ検出AIです！上の映像が元の内視鏡の動画で、下が今回開発した検出AIの動作動画です。青い枠で「ポリープだよ！」と主張してくれてますね！３ヶ月の学習の流れ基礎的な機械学習手法のスクラッチまずは数学的な理解から始めました。手法ごとの数式を読んで、それを実装に落としていきます。 -　線形回帰 -　重回帰 -　主成分分析 -　Kmeans -　決定木 -　SVM 悶え苦しんだのですが、この時期に数式に対するアレルギーがほぐれていきました！最初は2乗誤差の微分変形を理解するのに苦労した思い出があります。このときに一番参考になった書籍は「やさしく学ぶ機械学習を理解するための数学のきほん」ですこれで機械学習の更新の概念が腹落ちしました。オススメ！ kaggleへの挑戦定番のタイタニックや良質なコンペの
slay-t 2019/01/31
AI

deeplearning

学習

画像

勉強
リンク
NVDLAのConvolution DMAが実行する畳み込みの手順の解析 - FPGA開発日記
NVDLAというか、畳み込み演算をどのようにハードウェアで実現するかということをさらに掘り下げている。 NVDLA : Unit Description Unit Description — NVDLA Documentation NVDLAのConvolution DMAは、以下のような画像に対して入力画像とカーネルを畳み込むことを考える。ここではチャネルについては無視している。上記の図における、各パラメータは以下の通りである。 Top Padding(TP) : 画像データに対して上部に何ピクセルパディングを入れるか。 Bottom Padding(BP) : 画像データに対して下部に何ピクセルパディングを入れるか。 Left Padding(LP) : 画像データに対して左部に何ピクセルパディングを入れるか。 Right Padding(RP) : 画像データに対して右部に何ピクセ
slay-t 2018/09/19
開発

画像

データ

deeplearning

fpga
リンク
GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less
CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。超解像とは？超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を超解像（Super Resolution）と呼ばれます。（参照元：二次元画像を拡大したいと思ったことはありませんか？ - デー）このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう
slay-t 2018/07/23
学習

機械学習

deeplearning

画像
リンク
1