SSII2020TS: Event-Based Camera の基礎と ニューラルネットワークによる信号処理 〜 生き物のように「変化」を捉えるビジョンセ...SSII
はじめに ポケモンについて何となく知っている人向けの記事です(デジモンは知らなくてOK) 3月ごろにポケモンたかさおじさんが集計したアンケートの分析をお手伝いしたところ、アンケートの自由記述回答の6353件中、155件もデジモンについて言及するコメントがあった。 「デジモンと区別付かないよね」 「もはやポケモンじゃない…。デジモン…。昔のデザインに戻ってほしいなぁ…。。。」 「主観ですが、伝説のポケモンが角張った印象で、デジモンのような印象を受ける。」 「全体的に毛がなさそうなツルッとしたフォルムの子達が増えた気がします。デジモンっぽい」 「デザインがごちゃごちゃしすぎて子供が描くのが難しい デジモンに近くなってきている」 「ダイパまでのデザインがポケモンっぽいデザイン。それ以降はデジモンみたいな雰囲気。」 私は幼少期からポケモンには触れてきたが、デジモンにはあまり縁がなかったため、 デジ
どうも。フロントエンドエンジニアの @Quramy です。 さて、前回、1日10万枚の画像を検証するためにやったことで書いているとおり、reg-suitという画像に特化した回帰テストツールをメンテしています。 画像回帰テストという文脈において、差分の可視化方法はとても重要なファクターです。なぜなら、画像(=スナップショット)に差分が発生したからといって、それすなわち棄却、というわけではなく、その差分の内容を判断して、意図せぬ変更であれば棄却、意図した変更であればexpectedを更新する必要があります。すなわち、ワークフローに目視による差分のレビューが発生するのです。 そこで、少しだけ異なる2枚の画像について差分を効果的に可視化する、というテーマに向き合ってみました。 主にC++とOpenCVでの実装ですが、これらの知識が無くとも読めるよう、コードやAPIへの言及を少なくして、中間画像で説
「スゲー。これが今の日本の技術か……」 「世間はここまで進歩していたのか」 開発したのは、兵庫県西脇市に本社を置くシステム開発会社・ブレイン。創業35年、いまも社員20人のうち約16人がエンジニアという、生粋の技術者集団だ。 約10年前にゼロから開発スタート マシンの名前は「BakeryScan」(ベーカリースキャン)。「お店に提供を始めたのは今から4年ほど前。最近になって突然『ネットですごい反響がある』と人に言われて驚いた」――ブレインの原進之介執行役員はこう話す。 BakeryScanの開発が始まったのは2008年にさかのぼる。きっかけは、地元・兵庫県のパン店社長から相談を受けたことだった。 「人が足りなくて困っている。経験の浅い外国人スタッフでもレジ打ちや接客ができるようなシステムを作ってほしい」――。 だが、同社のパンに関する専門知識はゼロ。そこから待ち受けていたのは、約6年にわた
以前に試した、アイドル顔識別の性能評価。 memo.sugyan.com それから半年以上も経ってデータ数も増えたし ちょっと確かめたいこともあったので、再び試してみた。 新データセット 前回は 40人×180件 で 計7,200件 を用意したけど、今回はもう少し多めにデータが集まっていたので(卒業などでもうアイドルではなくなってしまった子も居るけど…)、今回は 120人×200件 で 計24,000件 を抽出してデータセットを作成した。 実際にラベル付けしたデータから抽出してみると、元が同じ画像なのに加工や顔検出器のブレなどで別の顔画像として登録されてしまっているもの、明らかに同じ日・同じ場所で連写していて「ほぼ同じ顔画像」と思われるもの などの重複が結構あることに気付いて、頑張って出来る限り排除した。 前回もある程度は人力でチェックしていたけど、今回は学習済みモデルに食わせた中間層出力
「will・can・must」って聞いたことありますでしょうか?就活生が就職の際に色々考えたり、社会人が自身のキャリアを考えたりする時などのために、色んな人が薦めているフレームワークです。「must ・can・will」とか、「will・must・can」とか順番が大事だ!みたいな考え方もあるみたいです。そんなフレームワークを元に、後輩やメンバーに話したりしてたのですが、割りと好評だったので、今回はてらもと的「will・can・must」の考え方について書いてみます。 4月から新しい期が始まり、いろんな変化がある中でゴールデンウィークに突入し、その後、いわゆる「5月病」的になってる方とかの役に立てれば幸いです。 「will・can・must」の発祥は? 色々調べてみたのですが、かの有名な、ドラッカーの言葉が元になっているようです。ドラッカーは、組織として成果を上げるための優先順位として、m
はじめに 十名~数十名ぐらいのプロジェクトで開発することの多いドリコムだが, プロジェクトの中に「プロジェクトリード職」という役割を置いている。 プロジェクトの実現性と健全性を担保するのが仕事だ。 ディレクター,プロダクトデザイン,プランナー,アート,エンジニアリーダーという風に 職種別のリード職を設けていて,エンジニアリーダーの場合はアーキテクチャや安定稼働, (技術的な) ユーザビリティ等への専門性を持って責任を負うのと,エンジニアチームの チーム作りもミッションに加えている。 最近は開発ライン数が増えてきたこともあり,新卒 2,3 年目のリード職が増えてきた。 リード職になった人に「一メンバーだった頃と何が違う?」と聞くと, よく「視野が広くなった」と返ってくる。 視野が広くなるとは具体的にどういうことなのか,掘り下げてみようと思う。 主に 2 年目エンジニア向けのエントリです。 仕
(この記事はGoogle Cloud Platform Advent Calendar 2015の12月3日分の記事です) Cloud Vision APIと私 Googleに入ってからまもなく5年、Google Cloud Platformのデベロッパーアドボケイト(エバンジェリストみたいな役割)の仕事に就いてから1年が経ちました。仕事の半分はアジア地域向けの開発者コミュニティ支援で、残り半分はGCPの新製品ローンチの支援をグローバル向けに行っています。 特にここ半年は、TensorFlowをはじめ、GCPの機械学習系プロダクトのローンチ支援にフォーカスしています。TensorFlowはその序章で、公開前からAlphaカスタマー向けのスライドを作ったり説明やデモしたりしていました。 そうしたGCPの新しい機械学習系サービスのひとつが、Cloud Vision APIです。これはGoogl
皆様はコンピュータビジョンという用語をご存知でしょうか。例えばデジタルカメラに搭載されている顔画像認識や、Google Street Viewの360度パノラマ表示、XBox360のKinectによるプレイヤーのジェスチャー認識など、これらは全てコンピュータビジョンの技術による製品です。 この連載では「コンピュータビジョンを応用した実際の製品」を毎回1つのテーマのもとで紹介し、その仕組みを誰でも理解できるレベルで簡単に解説していきます。これにより「いかにコンピュータビジョンが身近な存在で、かつ、いかにその使われている場所が急速に増えているか」をたくさんの方に知っていただきたいと思っております。 私は今回の連載のテーマであるコンピュータビジョン技術の研究者です。慶應義塾大学 理工学部 青木研究室という研究室に所属しております。大学院の修士課程を卒業したあと某企業にてソフトウェア開発の仕事を行
2023.2.20お知らせ教育機関における遠隔講義等でのイリュージョンフォーラム利用について 2023.2.20お知らせ触覚の錯覚「錯触」や、異なる感覚間の関係性によって生ずる錯覚「多感覚統合」のカテゴリを新設したほか、聴覚の錯覚「錯聴」に新しいデモを追加しました。追加されたデモの詳細についてはこちらをご覧ください。 過去のお知らせ 2023.2.20お知らせ 教育機関における遠隔講義等でのイリュージョンフォーラム利用について 新型コロナウィルス(COVID-19)感染症対策として、教育機関において遠隔授業が広く実施されています。この状況を考慮し、NTTコミュニケーション科学基礎研究所では、教育機関の正規の教育課程としての遠隔講義・演習の場合に限り、イリュージョンフォーラム(以下、本サイト)のコンテンツを弊所の事前の承諾なく資料として利用することを認めます。講義・演習には遠隔講義(zoom
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く