[B! vision] muddydixonのブックマーク

muddydixon id:muddydixon

visionに関するmuddydixonのブックマーク (13)

画像認識の初歩、SIFT,SURF特徴量
SSII2020TS: Event-Based Camera の基礎とニューラルネットワークによる信号処理〜生き物のように「変化」を捉えるビジョンセ...SSII
muddydixon 2020/08/20
sift

surf

vision

image

presentation
リンク
最近のポケモンはデジモンっぽいのか、ディープラーニングに聞いてみた - Qiita
はじめにポケモンについて何となく知っている人向けの記事です（デジモンは知らなくてOK）３月ごろにポケモンたかさおじさんが集計したアンケートの分析をお手伝いしたところ、アンケートの自由記述回答の6353件中、155件もデジモンについて言及するコメントがあった。「デジモンと区別付かないよね」「もはやポケモンじゃない…。デジモン…。昔のデザインに戻ってほしいなぁ…。。。」「主観ですが、伝説のポケモンが角張った印象で、デジモンのような印象を受ける。」「全体的に毛がなさそうなツルッとしたフォルムの子達が増えた気がします。デジモンっぽい」「デザインがごちゃごちゃしすぎて子供が描くのが難しい　デジモンに近くなってきている」「ダイパまでのデザインがポケモンっぽいデザイン。それ以降はデジモンみたいな雰囲気。」私は幼少期からポケモンには触れてきたが、デジモンにはあまり縁がなかったため、デジ
muddydixon 2020/08/15
大作であった

vision

image

machinelearning

deeplearning

visualization
リンク
わかりやすい画像のdiffを求めて - Qiita
どうも。フロントエンドエンジニアの @Quramy です。さて、前回、1日10万枚の画像を検証するためにやったことで書いているとおり、reg-suitという画像に特化した回帰テストツールをメンテしています。画像回帰テストという文脈において、差分の可視化方法はとても重要なファクターです。なぜなら、画像(=スナップショット)に差分が発生したからといって、それすなわち棄却、というわけではなく、その差分の内容を判断して、意図せぬ変更であれば棄却、意図した変更であればexpectedを更新する必要があります。すなわち、ワークフローに目視による差分のレビューが発生するのです。そこで、少しだけ異なる2枚の画像について差分を効果的に可視化する、というテーマに向き合ってみました。主にC++とOpenCVでの実装ですが、これらの知識が無くとも読めるよう、コードやAPIへの言及を少なくして、中間画像で説
muddydixon 2020/08/13
vision

sift

algorithms
リンク
SIFT (Scale-Invariant Feature Transform)の導入 — OpenCV-Python Tutorials 1 documentation
muddydixon 2020/08/13
vision

image

opencv

sift

algorithms
リンク
「すごすぎる」――地方のパン屋が“AIレジ”で超絶進化　足かけ10年、たった20人の開発会社の苦労の物語
「スゲー。これが今の日本の技術か……」「世間はここまで進歩していたのか」開発したのは、兵庫県西脇市に本社を置くシステム開発会社・ブレイン。創業35年、いまも社員20人のうち約16人がエンジニアという、生粋の技術者集団だ。約10年前にゼロから開発スタートマシンの名前は「BakeryScan」（ベーカリースキャン）。「お店に提供を始めたのは今から4年ほど前。最近になって突然『ネットですごい反響がある』と人に言われて驚いた」――ブレインの原進之介執行役員はこう話す。 BakeryScanの開発が始まったのは2008年にさかのぼる。きっかけは、地元・兵庫県のパン店社長から相談を受けたことだった。「人が足りなくて困っている。経験の浅い外国人スタッフでもレジ打ちや接客ができるようなシステムを作ってほしい」――。だが、同社のパンに関する専門知識はゼロ。そこから待ち受けていたのは、約6年にわた
muddydixon 2017/05/16
「高度な機械との共存によって、人がいま以上に活躍できる未来もあるのではないかと考えている」範囲を知ってる人の話

vision

machinelearning

ai

payment

money

system
リンク
TensorFlowによるDeep Learningでのアイドル顔識別モデルの性能評価と実験その2 - すぎゃーんメモ
以前に試した、アイドル顔識別の性能評価。 memo.sugyan.com それから半年以上も経ってデータ数も増えたしちょっと確かめたいこともあったので、再び試してみた。新データセット前回は 40人×180件で計7,200件を用意したけど、今回はもう少し多めにデータが集まっていたので(卒業などでもうアイドルではなくなってしまった子も居るけど…)、今回は 120人×200件で計24,000件を抽出してデータセットを作成した。実際にラベル付けしたデータから抽出してみると、元が同じ画像なのに加工や顔検出器のブレなどで別の顔画像として登録されてしまっているもの、明らかに同じ日・同じ場所で連写していて「ほぼ同じ顔画像」と思われるものなどの重複が結構あることに気付いて、頑張って出来る限り排除した。前回もある程度は人力でチェックしていたけど、今回は学習済みモデルに食わせた中間層出力
muddydixon 2017/02/23
tensorflow

deeplearning

cognition

vision

face
リンク
仕事とかキャリアでモヤモヤする時は「will・can・must」で整理するといいかもしれないというお話 : てらもとblog
「will・can・must」って聞いたことありますでしょうか？就活生が就職の際に色々考えたり、社会人が自身のキャリアを考えたりする時などのために、色んな人が薦めているフレームワークです。「must ・can・will」とか、「will・must・can」とか順番が大事だ！みたいな考え方もあるみたいです。そんなフレームワークを元に、後輩やメンバーに話したりしてたのですが、割りと好評だったので、今回はてらもと的「will・can・must」の考え方について書いてみます。 4月から新しい期が始まり、いろんな変化がある中でゴールデンウィークに突入し、その後、いわゆる「5月病」的になってる方とかの役に立てれば幸いです。「ｗill・can・must」の発祥は？色々調べてみたのですが、かの有名な、ドラッカーの言葉が元になっているようです。ドラッカーは、組織として成果を上げるための優先順位として、m
muddydixon 2016/12/08
motivation

capability

vision

career

management
リンク
リーダーであるための視野・視座・視点 - Tech Inside Drecom
はじめに十名～数十名ぐらいのプロジェクトで開発することの多いドリコムだが，プロジェクトの中に「プロジェクトリード職」という役割を置いている。プロジェクトの実現性と健全性を担保するのが仕事だ。ディレクター，プロダクトデザイン，プランナー，アート，エンジニアリーダーという風に職種別のリード職を設けていて，エンジニアリーダーの場合はアーキテクチャや安定稼働， (技術的な) ユーザビリティ等への専門性を持って責任を負うのと，エンジニアチームのチーム作りもミッションに加えている。最近は開発ライン数が増えてきたこともあり，新卒 2，3 年目のリード職が増えてきた。リード職になった人に「一メンバーだった頃と何が違う？」と聞くと，よく「視野が広くなった」と返ってくる。視野が広くなるとは具体的にどういうことなのか，掘り下げてみようと思う。主に 2 年目エンジニア向けのエントリです。仕
muddydixon 2016/12/08
「問題発見能力の成長」はダブルループ学習と近いと思ってる

management

product

leader

vision
リンク
Cloud Vision APIの凄さを伝えるべくRasPi botとビデオを作った話
（この記事はGoogle Cloud Platform Advent Calendar 2015の12月3日分の記事です） Cloud Vision APIと私 Googleに入ってからまもなく5年、Google Cloud Platformのデベロッパーアドボケイト（エバンジェリストみたいな役割）の仕事に就いてから1年が経ちました。仕事の半分はアジア地域向けの開発者コミュニティ支援で、残り半分はGCPの新製品ローンチの支援をグローバル向けに行っています。特にここ半年は、TensorFlowをはじめ、GCPの機械学習系プロダクトのローンチ支援にフォーカスしています。TensorFlowはその序章で、公開前からAlphaカスタマー向けのスライドを作ったり説明やデモしたりしていました。そうしたGCPの新しい機械学習系サービスのひとつが、Cloud Vision APIです。これはGoogl
muddydixon 2015/12/03
google

vision

cognition

machinelearning

api
リンク
コンピュータビジョンのセカイ - 今そこにあるミライ(1) 身近なものとなってきたコンピュータビジョンの世界
皆様はコンピュータビジョンという用語をご存知でしょうか。例えばデジタルカメラに搭載されている顔画像認識や、Google Street Viewの360度パノラマ表示、XBox360のKinectによるプレイヤーのジェスチャー認識など、これらは全てコンピュータビジョンの技術による製品です。この連載では「コンピュータビジョンを応用した実際の製品」を毎回1つのテーマのもとで紹介し、その仕組みを誰でも理解できるレベルで簡単に解説していきます。これにより「いかにコンピュータビジョンが身近な存在で、かつ、いかにその使われている場所が急速に増えているか」をたくさんの方に知っていただきたいと思っております。私は今回の連載のテーマであるコンピュータビジョン技術の研究者です。慶應義塾大学理工学部青木研究室という研究室に所属しております。大学院の修士課程を卒業したあと某企業にてソフトウェア開発の仕事を行
muddydixon 2015/10/14
machinelearning

algorithms

vision

camera
リンク
Engadget | Technology News & Reviews
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
muddydixon 2015/01/22
[[gadget]未来か夢か

vision

microsoft

3d
リンク
錯覚の世界
2023.2.20お知らせ教育機関における遠隔講義等でのイリュージョンフォーラム利用について 2023.2.20お知らせ触覚の錯覚「錯触」や、異なる感覚間の関係性によって生ずる錯覚「多感覚統合」のカテゴリを新設したほか、聴覚の錯覚「錯聴」に新しいデモを追加しました。追加されたデモの詳細についてはこちらをご覧ください。過去のお知らせ 2023.2.20お知らせ教育機関における遠隔講義等でのイリュージョンフォーラム利用について新型コロナウィルス（COVID-19）感染症対策として、教育機関において遠隔授業が広く実施されています。この状況を考慮し、NTTコミュニケーション科学基礎研究所では、教育機関の正規の教育課程としての遠隔講義・演習の場合に限り、イリュージョンフォーラム（以下、本サイト）のコンテンツを弊所の事前の承諾なく資料として利用することを認めます。講義・演習には遠隔講義（zoom
muddydixon 2013/10/31
illustration

vision
リンク
ImageNet Large Scale Visual Recognition Competition 2012 (ILSVRC2012)
Weighted sum of scores from each classifier with SIFT+FV, LBP+FV, GIST+FV, and CSIFT+FV, respectively.
muddydixon 2012/10/10
neuralnetwork

vision

machinelearning
リンク
1