ヤハクイザシュニナ @SIDE_7 この画像見て、ほとんどの人が「まーたグリッチノイズか、流行ってんなー」って流し見しちゃうだろうけどちょっと待て!画像拡大してみるとコレ画像処理じゃなくて被写体の色に合わせたファイルや本のようなものを積み上げて撮ってんぞ!かっけー! pic.twitter.com/yEif9JGhAg 2022-10-25 16:57:27
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
こんにちは ハタ です。 今回は以前iOSのクライアントサイドで実装していた通知ぼかし機能をサーバサイド(配信サーバ)上に再実装した事を書きたいなと思います 今回はかなり内容を絞りに絞ったのですが、長くなってしまいました、、 目次機能があったのでつけてみました、読み飛ばして読みやすくなった(?)かもしれません 目次 目次 通知ぼかし機能とは サーバサイド通知ぼかし プロトタイプの実装 苦労の始まり その1 画像処理速度 苦労の始まり その2 データ量 さらなる計算量の削減を求めて さらなる最適化へ Halide の世界へ 簡単な halide の紹介 苦労の始まり その3 いざ リリース リリースその後 We are hiring! 通知ぼかし機能とは 通知ぼかし機能は、ミラティブ上での配信中に写り込んでしまったiOSの通知ダイアログをダイアログの中身を見えないようにぼかし処理をしてあげる
何ヶ月か前にTwitterのタイムラインに流れてきたのですが、それっきり話題を聞かないので検証してみることにしました。 ちなみに、個人的に普段使って慣れているのは、癖が少なくて扱いやすい scikit-image です。 (OpenCVはBGRがデフォルトなので基本的に避けたいですし、PILは癖が強めなのであまり好きではないです) 高速の画像処理ライブラリを使うモチベは、もちろん Kaggle です。 特に画像の読み込みが速いと、時間短縮に直結するので個人的に嬉しいです。 Lyconとは C++で書かれたPython用の軽量画像処理ライブラリらしいです。 PyPI にあるので pip install ですぐに使えます。(一応依存関係も気にしなきゃいけないかも) github.com 性能の割にスターが控えめな気がする。 試しに使ってみる 多少の実戦を仮定して、Kaggle の Notebo
WebAssemblyがSIMDをサポート、「WebAssembly SIMD」がChromeやFirefoxで標準実装。画像処理や物理演算など高速実行 ChromeなどのWebブラウザに搭載されているJavaScriptエンジン「V8」の開発チームは、WebAssemblyでSIMD命令をサポートする「WebAssembly SIMD」を来月、2021年5月にリリース予定のChrome 91からデフォルトで利用可能にすることを明らかにしました。 Firefoxでもx86版、x86-46版においてはすでにフラグを設定することでWebAssembly SIMDが利用可能になっており、Node.jsでもフラグの設定で利用可能になっています。 これによりWebAssemblyで画像処理などが高速に実行できるようになることが期待されます。 WebAssembly SIMD will be ship
photon https://silvia-odwyer.github.io/photon/ photonの特徴 引用: photon from GitHub 「Photon」は、WebAssemblyにコンパイルされる高性能のRust画像処理ライブラリ。モジュールに組み込むことで、Web・ネイティブ上で高速な画像処理が可能になります。 Photonを試してみる ヘッダーにある「ファイルを選択」から、処理したい画像をアップロード。 続いて、左メニューに用意された様々なエフェクトを画像に提供していきます。プレビューとともに処理にかかった時間も併記され、高速な処理を実感できます。 画像の反転にかかる時間もわずか47ms! Photonの導入 https://github.com/silvia-odwyer/photon オープンソースとして提供されており、npmで既存プロダクトにモジュールとし
Metabase Qは2月1日(米国時間)、「ImageMagick: The hidden vulnerability behind your online images」において、同社のセキュリティチームが発見した画像処理ソフトウェア「ImageMagick」の2件のゼロデイ脆弱性について報告した。これらの脆弱性を悪用されると、攻撃者によって標的のシステム上でサービス拒否(DoS)や情報漏洩などの攻撃を受ける可能性がある。 ImageMagick: The hidden vulnerability behind your online images - Metabase Q ImageMagickは画像の表示や操作、フォーマット変換などを行うことができるオープンソースのソフトウェアスイート。非常に多くの画像フォーマットに対応していることから、画像を扱う世界中のWebサイトで広く利用され
転職サービス「doda」の求人情報サービス(以下、求人広告)では、求人広告制作のプロフェッショナルが取材、撮影、編集などを行って広告を制作。広告出稿いただいた法人企業様の魅力を余すことなく転職希望者様にお届けしています。 しかし対面撮影の機会が減ったコロナ禍においては、写真や画像は法人企業様から提供いただくことも多く、照明の加減などによって「顔色が不自然になってしまっているけれど、他に素材がない」といったこともしばしば。 そこで今回、コンピュータビジョン領域における補正・加工技術を活用し、画像処理を最適に行うツールを構築。PoCが行われ、作業工数の大幅な削減などの成果をあげています。本プロジェクトを担当した田口、宮下、芝、そして求人広告制作のマネジャーである佐古に話を聞きました。 始まりは「画像処理技術を活用し、社内で浸透させたい」という思い 現場・ビジネス・エンジニアの密な連携でプロジェ
SKYLUM社の写真編集ソフト「Luminar(ルミナー)」。恥ずかしながらこれまでその存在を知らなかったのですが、今回最新版の「Luminar 4」(11月18日発売)をモニター使用させて貰えることになり、使ってみたところこれがかなり凄いアプリで驚きました。 Via : https://www.swtoo.com/news/2019/10/luminar4-launched/ まだ、ほんの一部分しか使えていませんが、そのインパクトが新鮮なうちにまずはファーストインプレッションとして紹介しつつ、適宜追加レビューを上げて行く予定です。 2020.6.1追記:Luminar 4.2にアップデートされています(2020.3.16) Luminar 4.2へのアップデートのお知らせ!新機能が追加され、写真家とアーティストの両方により創造性をもたらす究極のソフトへ(skylum.com) 新たな機能
NHKで再放送された(デジタルリマスター版)プロジェクトX「男たちの復活戦 デジタルカメラに賭ける」を見た。カシオの技術者たちが、アナログスチルカメラの大失敗を乗り越えて QV-10 を開発・発売するまでの話。パソコンにデータを取り込めるようにすることで魅力がより増して大売れ、みたいな話に感心しつつ、ふと、「そういえば自分もそのころは、当然のようにデータを計算機に取り込んで画像処理してた」みたいなことも思ったので、当時の画像処理がどんな感じだったのか、誰も読まないだろう昔話などをしてみる。 簡単に自分のプロフィールを書いておく。小学校時代にパソコン(日立ベーシックマスターとか)に触れ、中学時代にはポケコンの BASIC 等でプログラミング。しかしこのころはむしろアマチュア無線や電子工作が中心だった。高校時代に K&R でC言語を習得し、レイトレーシングで生成したカラー画像をディザリングで1
Rustは米モジラ財団が支援するオープンソースのプログラミング言語だ。強い静的型付けを採用するコンパイル言語であり、型やメモリーの安全性、並行性などを重視している。文法は、中カッコによるブロックの指定、ifやforによる制御など、C/C++に似ている。 では、開発現場はどのようにRustを活用しているのだろうか。Rustを使ったシステム構築を進めるGMOペパボの事例を基に、その導入効果を探る。 できるだけメモリー使用量を抑えたい GMOペパボは2014年からWebサービス「SUZURI」を展開している。ユーザーが作製した画像をTシャツやトートバッグなどのグッズにプリントし、そのグッズを購入・販売できるサービスだ。 同サービスでは、ユーザーが画像をGMOペパボのサーバーにアップロードすると、プレビュー画面が表示される。プリント後のグッズがどのような見栄えになるのかを確認しやすい。例えばTシャ
幾何形状マッチングはOpenCVには非実装だったため、自動的に候補から除外されます。個人的にはかなり便利なマッチング方式だと思うので、実装してほしいんですけどね…。 次に、形状変化への強さは特徴点マッチングが優秀です。 テンプレートマッチングと幾何形状マッチングは、マッチングの元画像と対象画像が拡大・縮小・回転を用いて一致するものしか対応できません。 一方の特徴点マッチングは、拡大・縮小・回転に加え、せん断・歪みまで対応できます。冒頭にもあるように斜めから見た画像(=歪み変形した画像)同士を比較したいので、特徴点マッチングを採用しました。 ちなみに、拡大・縮小・回転・せん断が可能で、更に移動を実現できる変形をアフィン変換(変形)、このアフィン変換に歪み変形を加えたものを射影変換(変形)と呼びます。 画像の多くの箇所が同時に色味の変化を起こすことはないだろうと予想し、特徴点マッチングで問題な
Linuxは、標準機能や膨大な数のフリーソフト、Linuxならではの多彩なコマンドラインツールを使うことで、より便利にカスタマイズできる。この特集では、そうした数々の「便利ワザ」を紹介する。それぞれの難度は、簡単に使いこなせる「Lev.1」からある程度の専門知識が必要な「Lev.3」の3段階のレベルで示している。 13 画像ファイルをコマンドで加工する(Lv.2) 多数の画像ファイルを加工したいときは、「convert」コマンドを使うと便利です。convertは、画像処理用のツールを集めた「ImageMagick」に含まれるコマンドです。ImageMagickは、次のコマンドでインストールします。
AI時代に必要な画像処理の本 今や猫も杓子もAIだディープラーニングだと言われる時代です。特に画像認識だと、とりあえずAIでしょ!みたいな感じはありますが、やはりそのバックグラウンドにある基本的な画像処理は重要なのではないかなと思う今日この頃です。 そんなことを思ったのは、Interface誌2020年7月号の画像処理特集が良かったからです。 Interface(インターフェース) 2020年 07 月号 CQ出版Amazon 気づいている人は気づいていると思うのですが、Interface誌の画像処理特集は毎年の恒例行事です(笑)正直、内容も同じような感じなので(めちゃくちゃ失礼)、今年は買わなくても良いかなと思っていたのですが、YouTube時代の画像処理特集にあった写真の、筆者の身体の張り具合をみて思わず手を出してしまいました。 Interface誌より引用。話題のFaceAppなんて
要約 背景 WebAssembly (WASM) とは? Rust言語とは? サンプルアプリ概要 LBP特徴量計算をRustで実装 フロントエンド環境構築 バックエンド環境構築 スキーマ定義 Rust実装 WASMバイナリの生成 TypeScript実装 実行結果 まとめ メンバー募集しています! おまけ こんにちは!美味しいタコスを食べることを専門としているプロダクト開発部エンジニアの井上です。 要約 WebAssembly(WASM)、Rustは近年注目されている技術であり、これを利用することでWebアプリケーション上で高速な画像処理を実現できるよ。 我々も画像前処理を行っていたWindowsデスクトップアプリケーションを、WebAssembly+Rustを使用してWebアプリケーションに置き換えたよ。 Rust言語で実装した画像処理をWASMにコンパイル、そしてWebアプリケーション
2023年3月14日(火)に、OpenAIが「GPT-4」を正式発表しました。GPT-4はテキストだけでなく画像の入力も受付ける「マルチモーダルAI」として開発されており、「人間用の試験問題を解く」「依頼に従ってプログラミングする」「『この画像は、何が面白いの?』といった質問に答える」といった動作を実現。さらに、日本語を含む英語以外の言語での性能も非常に高度な領域に達しているとのことです。 GPT-4 Research https://openai.com/research/gpt-4 GPT-4 Product https://openai.com/product/gpt-4 Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https
はじめに 趣味でノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」を作りました。 その紹介の記事です。中身にOpenCVガッツリ使っているからアドカレOKですよね。。。👀? ガッツリ使っているという意味では、GUI部分の DearPyGui のほうがガッツリ使っているかもしれませんが🤔 「Image-Processing-Node-Editor」とは 以下のように、ノードを接続していくことで、処理結果を可視化しながら画像処理が行えるツールです。 以下のような特徴があります。 主要な処理は全てPython ※ライブラリ部分除く 各処理を可視化しながら画像処理が試せる 自作ノードの追加が容易 (だと信じている) 記事書くために見直していましたが、イマイチ複雑ですわ、、、😇 OSS (Apache 2.0ライセンス) デフォルトでいくつかのAI機
機械学習用の画像の前処理方法を調べたのを書いていきます。 中途半端な内容ですが、今後書き足していくと思います。 試行環境 Windows10 python 3.6 opencv-python 4.1.2.30 閾値処理: cv.Threshold(src, threshold, maxValue, thresholdType) opencvドキュメント http://labs.eecs.tottori-u.ac.jp/sd/Member/oyamada/OpenCV/html/py_tutorials/py_imgproc/py_thresholding/py_thresholding.html 閾値を指定して二値化 適当なグラデーション画像を作って二値化してみます # make gray scale picture im_gray = np.array([np.arange(0, 256
独自のディープラーニング画像処理技術を確立し、写真の原理上避けられない現象の補正を実現 2023/2/20 ある瞬間、ある場所の光景は二度と訪れることはありません。しかし、それはカメラで記録することができます。見たことがなかった絶景や、後で見返せば記憶がまざまざとよみがえる感動の瞬間など、カメラは素晴らしい瞬間を写真として残してくれるのです。 ところが、実は写真の画質には、避けることのできない課題がいくつかありました。例えば写真がざらついた感じに見えるノイズや、本来はないはずのまだら模様が見えるモアレ、レンズの原理に起因する像のボケなど、写真に影響を与える光学的要素により、見ている光景にはない情報が写りこんでしまうことがありました。広角レンズを使った場合のレンズ中心から外れた周辺部分の画質は、レンズの光学性能が低下してぼけやすく、プロフォトグラファーの撮影技術をもってしても、カバーしきれず
R&D チームの徳田(@dakuton)です。 今年の8月に開催されたECCV 2020のacceptされた論文のなかに、使い古された2値化画像処理をもとにした論文(+実装)があり気になったので、今回はそちらを少し調べて動かしてみた結果をご紹介します。 対象論文 A Generalization of Otsu’s Method and Minimum Error Thresholding 要点 簡単にいうと「既存手法をまとめて、ちょっとだけ融通の効く2値化画像処理にしたもの」の提案です。 ヒストグラムベースでの2値化しきい値を自動決定する手法 下記の既存手法を特殊ケースとして内包できるよう、一般化した式にまとめた Kittlerの2値化(MET: Minimum Error Thresholding): 2クラスの正規分布が存在すると仮定し、分布の重なる範囲にて別クラスに該当する画素が最
ヴイストン株式会社はRaspberry Pi 4を搭載し、高度な情報処理やネットワーク接続に対応した二足歩行ロボット「Robovie-Z」(ロボビー・ゼット)を発売することを発表した。 「Robovie-Z」はRaspberry Pi 4の処理能力を生かし、ロボット本体内での画像処理や各種の演算処理、ネットワークを活用した外部機器の連携などが可能。Raspberry Pi 4に対応した小型カメラを標準搭載しているため、AI処理などに基づいた高度な自律動作をプログラムすることもできる。サイズは高さ315mm×長さ164mm×幅110mm。重量は約1020g。自由度は20軸(脚部:6軸×2/腕部:3軸×2/頭部:2軸)。 二足歩行ロボットを活用した研究・開発用途やホビー用途・各種競技会への出場に活用できる。本体は組み立て済み、調整済みで27万円(税抜)。注文はヴイストン株式会社の公式Webショ
[CEDEC 2022]プリ機の“盛れる”はどのように実現しているのか。フリューのセッション「誰が写っても間違いなく"盛れる"、理想の写真を実現する画像処理技術」 編集部:御月亜希 ゲーム開発者向けカンファレンス「CEDEC 2022」の最終日となる2022年8月25日,「誰が写っても間違いなく"盛れる"、理想の写真を実現する画像処理技術 〜目を大きくするだけではない!プリントシール機における事例〜」というセッションが行われた。 アミューズメント施設でおなじみのプリントシール機がどのような画像処理をしているのかを,フリューの中嶋俊介氏が解説した。 フリュー プリントシール機事業部 ソフトウェア開発部 画像処理技術リーダー 中嶋俊介氏 プリントシール機を見たことがない人はいないと思うが,念のため説明すると,アミューズメント施設などに設置されている写真シール作成機のことだ。通称「プリ機」,さら
画像の欠損補間 実世界の問題において、データが欠損していることが多々あります。そのような場合にも、スパースであるという仮定をうまく利用することで、データの欠損を補間することができます。 前回、画像の再構成について紹介したとき、自然画像をパッチに区切って辞書学習を行うと、各パッチは得られた辞書を用いてスパースに表現できることがわかりました。実はこの辞書とスパース表現は、学習画像に、ある程度欠損があったとしても、うまく求めることができるのです。 なぜ、そんなことが可能かというと、例えば100変数の連立方程式を考えたときに、式の数は100個あれば全ての変数の値を決定できます。データとして10000個方程式があったとしても、そのうちの1%だけを使って連立方程式を解くことができます。また、方程式の解がほとんど0であるとわかっている場合も少数の方程式から解が得られることが知られています。つまり、100
人間は目から映像を取り込んで脳で処理しますが、コンピュータにも同じことができます。 スマホの顔認証システムのように、カメラで画像を取得して、チップで処理しているのです。 そんなコンピュータの画像処理の分野に革新が訪れようとしています。 アメリカ・ペンシルバニア大学(UPenn)電気システム工学科に所属するファシッド・アシティアニ氏ら研究チームが、1秒間に20億枚の画像処理が可能なニューラルネットワークを開発したのです。 従来は光を電気に変換してから処理していましたが、光のまま処理できるシステムを作ることで、処理速度を大きく向上させています。 研究の詳細は、2022年6月1日付の科学誌『Nature』に掲載されました。 Penn Engineers Create Chip That Can Process and Classify Nearly Two Billion Images per
本連載は「これから機械学習に取り組みたい」「ディープラーニングや機械学習を使った経験がある」といったエンジニアに向けて、データ量が少なくても分析が実現できる「スパースモデリング」という手法を紹介します。前回はスパースモデリングの代表的な手法であるLASSOについて解説をしてきました。今回は、辞書学習と呼ばれる手法を紹介し、画像処理への応用について解説します。 辞書学習とは LASSOとは、\(y\)と\(\Phi\)が与えられたとき、\(\frac{1}{2}\|y - \Phi x \|^2_2 + \lambda \|x\|_1\)を最小化するような\(x\)を見つける問題でした。これは、\(y = \Phi x\)に対して、観測値\(y\)は説明変数のうち少ないものの組み合わせで表現できるはずだという仮定に基づいています。 今回紹介する辞書学習は、観測値が与えられたとき、これらの観測
音楽ユニット「YOASOBI」のキービジュアルなどを手がけたイラストレーター・古塔つみ氏に対する炎上騒動が止まらない。古塔氏は自身のツイッターで「引用・オマージュ・再構築として製作した一部の作品を、権利者の許諾を得ずに投稿・販売してしまったことは事実です」と認めたものの、「模写についても盗用の意図はございません」と否定。しかし、新たな疑惑が続々と噴出し、ネットではさらなる追求が進んでいる。 【関連】古塔つみ氏『AKIRA』もトレパクか。“金田のバイク”酷似イラストを勝手に商品化、悪質手口に有名漫画家も「真っ黒」 トレースによる“パクリ”を否定も新たな疑惑が浮上 年齢・性別も非公開。謎のベールに包まれた人気イラストレーターの古塔つみ氏。YOASOBIの大ヒット曲「夜に駆ける」のキービジュアルを担当するなど、10代や20代の女性に支持される“彼女”に降って湧いたパクリ疑惑。 事の発端は、暴露系
ステレオ画像処理を P+P という謎の手法で実装した話(できる!マネキンチャレンジデータセット 後編)画像処理ComputerVisionDeepLearningMVSP+P 記事の要約 最終ゴールは、昨日作成した MVS (Multi View Stereo) のデプスマップのノイズ除去を行うこと。 具体的には、 P+P (Plane-Plus-Parallax) と呼ばれる手法を応用して再度デプスマップを作成し、MVS のデプスマップから共通する値のみ抽出する。 本記事では P+P とそれを応用したデプスマップの作成方法を概観し、それを Python3.7 で実装する。 こんにちは。サービスイノベーション部1年目社員の @dosada です。昨日の記事(できる!マネキンチャレンジデータセット(SfM・MVS編)) に続き @ohashi_zaemon とマネキンチャレンジデータセットを
初めに 皆さん初めましてmosyoryです。 画像処理に興味はあるがどうやってやるのかわからない、そんな方もいるのではないでしょうか。 本記事ではWindows・Macの環境でPythonとOpenCVを使ってちょっとした画像処理の方法を紹介したいと思います。関数等の詳細な解説は行っていないので予めご了承ください。 初めに OpenCVとは OpenCVのインストール Windows Mac pipでインストールできない 基本操作 読み込み 表示 保存 画像処理 色空間の変換 二値化処理 輪郭検出 輪郭描画 終わりに 参考サイト OpenCVとは OpenCV(Open Source Computer Vision Library)とはオープンソースコンピュータ・ビジョン・ライブラリです。 画像処理や汎用的な数学処理、機械学習に関するアルゴリズムが多数含まれています。 C+、Python、
この記事は KLab Engineer Advent Calendar 2019 24日目の記事です。 AdventCalendarどころか、Qiitaへの、もっと言えばネットに向けた技術エントリの投稿自体が初めてになります suzuna-honda といいます。よろしくお願いします。 はじめに 私は書籍をスキャンして電子書籍として読む、いわゆる「本の自炊」を趣味としています。 不眠症のケがあり、眠くなるまでの暇潰しとして、自炊した本を読書するのが日課になっています。枕の横にはiPadが欠かせません。 どの程度、深く、この「本の自炊」と向き合っているかといいますと、 書籍のスキャン 1冊ごとにパッケージング、管理の為のタグ付け スキャンした画像の画質調整、端末(iPad/iPhone)への最適化 端末(iPad/iPhone)へのデータ転送、閲覧 までの一連のワークフロー、ほぼ全てのツール
皆さん、突然ですが上の画像をご覧ください。 (画像引用:OpenCV公式サイトより) これは、画像認識技術の応用例の一つです。コンピューターが映像の範囲内で移動する複数の人間を検知し、その移動をリアルタイムで追跡している様子が見て取れます。かなりの数の人がいるにも関わらず、ほとんどの人を正確に検出することができていますね。画像認識とは、このように画像の数値情報のパターンから写っている物体を認識する手法のことを指します。(本稿で度々登場する物体検出という用語も画像認識と同様の意味を持つと考えていいでしょう。) また、これは画像認識の例ですが、高精度の画像認識を行うために必要不可欠なのが画像処理の技術です。画像処理とは、コンピュータを用いて画像に対して行う、色を変換したり変形させたり、ぼかしたりするなどの処理全般を指します。画像処理を行うことで、コンピュータが画像内の物体を認識しやすくなります
はじめに ※本記事は2022年8月16日に20個のレシピを追加し50選へと更新いたしました。 AxrossRecipeを運営している松田です。 AxrossRecipe は、エンジニアの"アカデミックな教育"と"現場の業務"のスキルギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによるノウハウが"レシピ"として教材化されており、動くものを作りながらAI開発やデータ分析の流れを追体験できます。 AxrossRecipe: https://axross-recipe.com Twitter: https://twitter.com/AxrossRecipe_SB 画像処理とは 画像処理は、「動画像のデータに対して、コンピュータが何かしらの処理を施すこと」の総称で、「画像認識」や「物体検出」、「画像合成・加
Tesseract とは? Tesseract は、オープンソースの OCR エンジンです。 「OCR」とは、画像ファイル中の文字を、テキストファイルとして読み込む技術のことです。 Tesseract は、コマンドラインのインターフェースを実装しているため、パソコンへインストールするだけで、OCR ができます。 Tesseract と Python で画像処理するメリットは? Tesseract を Python と組み合わせて利用すれば、画像を前処理してから Tesseract へ渡すことができます。 これにより、OCR の精度が向上し、Tesseract が読み取った文字列を任意の形に処理できます。 例えば、紙に印刷された文書も、Tesseract を利用すれば、テキストデータとして保管できるのです。 さて、今回は、Tesseractを使って、画像処理でOCRを試してみたいと思います!
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く