タグ

画像処理に関するrabbit2goのブックマーク (92)

  • 写真をPNGに変換すると、EXIF情報はどうなるのか?|ハトォ

    カメラで写真を撮ると、画像にEXIF情報が記録されます。このEXIF情報、写真をPNGに変換すると失われるのでしょうか? 検証と結果iPhoneで撮影した写真(画像A)と、それをMacのプレビューアプリでPNGに変換したもの(画像B)を、それぞれ写真アプリで見てみました。 まず、画像Aの情報は、こんな感じです。 画像Bは、こんな感じ。 「Apple iPhone 12 mini」の右側を見ると、しっかりファイル形式が違うのがわかります。そしてEXIF情報である焦点距離やF値などはどちらとも表示されています。 ちなみに、↑のスクリーンショット自体の情報を確認すると… このようになります。まあスクリーンショットにはF値も何もないので、そりゃそうだって話ですね。 ということで、EXIF情報は変換後も保持されると見て良さそうです。 ※以下、余談です。 きっかけそもそもこの検証をやるきっかけになった

    写真をPNGに変換すると、EXIF情報はどうなるのか?|ハトォ
  • Apple製品でだけ違う表示にできる PNG ファイル

    PNG Parser Differential では、Apple のデバイスでだけ異なって表示される不思議な PNG ファイルが公開されています。 Windows + Chrome で見た同ページ iPad + Safari で見た全く同じページ (Chrome でも同じ) PNG の表示結果がまったく違い、”Hello World” が “Hello Apple” になっています。不思議ですね。 デビット・ブキャナン氏(David Buchanan)は、マルチスレッド対応のPNGデコーダを自作しようとしている時に、自分が作りこんだバグに気づいたということ。それは、一つのPNGファイルを分割してそれぞれを個別にzlibでデコードしたものを単純に結合しても、必ずしも元の画像に戻らないことに起因するバグだでした。リンク先には PoC のコードがあります。 もし分割の前半部分が非圧縮ブロックの途

    Apple製品でだけ違う表示にできる PNG ファイル
  • ゼロから作るRAW現像 - その1 - Moiz's journal

    追記 このブログ記事「ゼロから作るRAW現像」を大きく再構成してより読みやすくした書籍「PythonColabでできる-ゼロから作るRAW現像」を【技術書典6】にて頒布しました。 現在はBOOTHにて入手可能です。書籍+PDF版は2200円プラス送料、PDF版は1200円です。 moiz.booth.pm 追記 はじめに RAWファイルおよびRAWデータについて カメラ画像処理 準備 RAW画像読み込み 画像データ変換 ブラックレベル補正 簡易デモザイク ホワイトバランス補正 カラーマトリクス補正 ガンマ補正 まとめ 最後に 次の記事 改定履歴 はじめに 会社の同僚にrawpyというPython用のライブラリの存在を教えてもらいました。 これを使うと各種デジカメのRAWファイルから、BayerのRAWデータを抽出できます。以前はDCRAWのソースコードを改造してrawデータのダンプなどし

    ゼロから作るRAW現像 - その1 - Moiz's journal
  • M5 Stack/M5 StickC/Wio Terminalで使える高性能グラフィックライブラリ「LovyanGFX」 - Qiita

    らびやんさん開発のM5 Stack/M5 StickC/Wio Terminalなどのマイコンで動くグラフィックライブラリです。GitHubでOSSとして公開されています。リポジトリへのリンクは以下です。 LovyanGFX 自作GFX、LovyanGFXを公開しました。https://t.co/ilO0fkkGW9 M5.LcdをLovyanGFXにして利用したい場合はこちらを。https://t.co/00AIL5yt5Y 人柱募集中です~。 — らびやん (@lovyan03) April 12, 2020 セットアップ方法 マイコンそれぞれの基的なセットアップ方法・購入方法は、以下ブログ記事参照ください。 話題のマイコン「Wio Terminal」を買ってクソゲー作って動かしてみました 小型万能マイコン「M5Stack」で自分だけのクソダサいスマートウォッチを作る 個人的には、最

    M5 Stack/M5 StickC/Wio Terminalで使える高性能グラフィックライブラリ「LovyanGFX」 - Qiita
  • 【人類最難関の挑戦】サイゼリヤの間違い探しを現代技術を駆使し片面だけで解く(深層学習) - Qiita

    プロローグ ※この章は読み飛ばしても構いません 多くの人が挑むも解くことが叶わなかった人類史上の難問といわれるものがいくつかある. 数学界で最も有名な難問といえばおそらく「フェルマーの最終定理」であろう.弁護士であり数学者であったフェルマーが「解答を書くにはこの余白は狭すぎる」と書き残してこの世を去って以来,天才ワイルズが現代数学の成果を結集して証明を完成させるまで300年以上も数学者たちの挑戦を退け続けた.その他にも,京都大学の望月教授が宇宙際タイヒミュラー理論を用いて証明したといわれるABC予想や,7つのうち6つが現在も未解決であるミレニアム懸賞問題などはあまりにも有名である. 一方数学以外でも,例えば宇宙の始まりを巡る議論は多くの人を惹きつけてきた難問であり,アインシュタインやホーキングら天才たちの研究によって徐々にその姿が明らかになってきた.「我々はどこから来たのか,我々は何者か,

    【人類最難関の挑戦】サイゼリヤの間違い探しを現代技術を駆使し片面だけで解く(深層学習) - Qiita
  • 元画像処理エンジニアがサイゼリヤの間違い探しをOpenCVで解いてみた - Qiita

    はじめに 前職で産業機械に使用する画像処理の設定などを作っていたこともあり、サイゼリヤの間違い探しのアルゴリズムに気になった部分があったので、手を出してみました。 今回のお題 さすがに同じものを使うのは芸がないので、今回は下記の画像で間違い探しを行います。 Copyright Saizeriya Co,. Ltd All rights reserved. ここからは間違い探しの答えの情報が乗っています。 もしネタバレが嫌であれば、サイゼリヤのホームページからチャレンジしてみてください。 変更点…を実装する前に 前提の確認 まず、サイゼリヤの間違い探しについて確認しましょう。 サイゼリヤの間違い探しで注視すべきは次の2点です。 通常は印刷されているメニューを使う 色の違いも答えに含まれる 1は、画像ファイルは解像度を印刷用からディスプレイ用に変換している可能性が高いことを意味しています。 そ

    元画像処理エンジニアがサイゼリヤの間違い探しをOpenCVで解いてみた - Qiita
  • Pythonで画像を編集したり、文字を入れたりする - Qiita

    はじめに nana musicでサーバサイドエンジニアをやっている@xKxAxKxです この記事はnana music Advent Calendar 2018の19日目の記事です nanaのTwitterカードの画像が変更されたぞ! nanaのサウンドへのリンクをTwitterに投稿した時、以前は投稿ユーザのアイコンが表示されているだけだったんだけど、以下のように投稿ユーザのアイコン、再生ボタン画像、投稿パート毎の背景色画像、投稿楽曲タイトル、投稿楽曲アーティスト名、投稿ユーザ名の組み合わせで画像を生成し、それがTwitterカードの画像として使用されるようになった 画像ファイルを色々といじるの、割とカジュアルにやることができたので、どのような処理をやっているかについて書いていく 用意するもの アイコン画像 いらすとや様から借りた 中二病(厨二病)の女の子が自分で考えたかっこいいポーズを

    Pythonで画像を編集したり、文字を入れたりする - Qiita
  • サイゼリヤの間違い探しをロバストな画像処理で解く - Qiita

    幾何形状マッチングはOpenCVには非実装だったため、自動的に候補から除外されます。個人的にはかなり便利なマッチング方式だと思うので、実装してほしいんですけどね…。 次に、形状変化への強さは特徴点マッチングが優秀です。 テンプレートマッチングと幾何形状マッチングは、マッチングの元画像と対象画像が拡大・縮小・回転を用いて一致するものしか対応できません。 一方の特徴点マッチングは、拡大・縮小・回転に加え、せん断・歪みまで対応できます。冒頭にもあるように斜めから見た画像(=歪み変形した画像)同士を比較したいので、特徴点マッチングを採用しました。 ちなみに、拡大・縮小・回転・せん断が可能で、更に移動を実現できる変形をアフィン変換(変形)、このアフィン変換に歪み変形を加えたものを射影変換(変形)と呼びます。 画像の多くの箇所が同時に色味の変化を起こすことはないだろうと予想し、特徴点マッチングで問題な

    サイゼリヤの間違い探しをロバストな画像処理で解く - Qiita
  • OpenCV2の基礎 - Qiita

    というようにpkg-configをつかってコンパイルオプションを設定するとよい。 リファレンス ドキュメントはいろいろあるけど、網羅的に把握するには、とりあえず家のリファレンスを参照するのが良さそう。 OpenCV API Reference (日語版) 実際に読んだ中では、以下が良かった。 Introduction - OpenCV API Reference OpenCV.jp 逆引きリファレンス User Guide (pdf) (日語版pdf) 基的なライブラリ core - 多次元の疎でない配列を扱うMatを含む基的なデータ構造と関数を定義 imgproc - 画像処理(フィルタ・アフィン変換・色変換等) video - 動画解析 calib3d - 複数画像解析(カメラキャリブレーション・立体視・3D Reconstruction等) features2d - 特徴抽

    OpenCV2の基礎 - Qiita
  • OpenCVの画像処理をGPU(CUDA)で高速化する - Qiita

    この記事について Jetson NanoにGPU(CUDA)が有効なOpenCVをインストール PythonOpenCVのCUDA関数を使って、画像処理(リサイズ)を行う C++OpenCVのCUDA関数を使って、画像処理(リサイズ)を行う 結論 (512x512 -> 300x300のリサイズの場合) 以下のように高速化できた CPU: 2.8 [msec] GPU: 約0.8 [msec] 注意 画像サイズと処理内容によっては、GPUの方が遅くなるので注意 環境 Jetson Nano (jetson-nano-sd-r32.2-2019-07-16.img) OpenCV 4.1.0 測定方法 処理時間測定の前には、以下コマンドを実施 ### 依存パッケージのインストール ### sudo apt update sudo apt upgrade sudo apt -y insta

    OpenCVの画像処理をGPU(CUDA)で高速化する - Qiita
  • 「さようなら ImageMagick」の考察 - Qiita

    はじめに サイボウズさんの ImageMagick の利用をやめる記事について少し思う所を書きます。否定というよりアシストのつもりです。(2018年08月26日投稿) さようなら ImageMagick 自分のスタンスを3行でまとめると、 policy.xml で読み書き出来るファイル形式を絞れば、いうほど怖くはない ただ、ImageMagick に限らずサーバサイドで動かすのは手間と覚悟が要る Yahoobleed の件でコード品質が信用ならないと言われたら、ごめんなさい 「ImageMagick を外した理由」 サイボウズさんのブログでは、2017年の ImageMagick 脆弱性報告数が多いので駄目との事です。 脆弱性 ImageMagick には脆弱性が大量に存在します。 2017 年に報告された ImageMagick の脆弱性は 236 件 でした。 大量にある上にリモートコ

    「さようなら ImageMagick」の考察 - Qiita
  • YOLOv2(Keras / TensorFlow)でディープラーニングによる画像の物体検出を行う - Qiita

    やったこと 流行りのディープラーニングを使って、画像の物体検出を行いました。 今回は、YOLOv2というアルゴリズムを使って物体検出を行なっています。 YOLO(You Only Look Once)とは 畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた物体検出アルゴリズムです。現時点ではv1とv2が存在します。 YOLO(YOLOv1) 論文はこちら(2015年)。 従来とは異なり、画像をバウンディングボックスで分割してクラス分類を行なっている。 we frame object detection as a regression problem to spatially separated bounding boxes and associated class probabilities. 結果として、45FPSの処理速度を実現し

    YOLOv2(Keras / TensorFlow)でディープラーニングによる画像の物体検出を行う - Qiita
  • Raspberry Pi3で自動ノート取り装置を作った - いきるちから

    はじめに 数理情報工学実験第二という演習で、Raspberry Piをつかって何かを作ることになりました。そこでAMATERASUという自動ノート取り装置を作ったので紹介します。 そもそもRaspberry Piって? Raspberry Pi3 Model B ボード&ケースセット (Element14版, Clear)-Physical Computing Lab 出版社/メーカー: TechShareメディア: エレクトロニクスこの商品を含むブログ (3件) を見る これです。安くて小型で色んなセンサーをつけて遊べるコンピュータです。今回はカメラモジュールを使いました。 自動ノート取り装置とは 自動ノート取りの目標は、講義を撮影した動画*1を処理することで、ノートの代わりとして使える画像を出力することです。具体的には次のgifのような画像を次々出力していくのを目標にしています。黒くな

    Raspberry Pi3で自動ノート取り装置を作った - いきるちから
  • 画像処理で大腸菌のコロニー数を数えたかった話 - kivantium活動日記

    生物の実験でシャーレに生えた大腸菌のコロニーの数を数えるという作業をしたのですが、こんなものは人間の仕事ではないので自動化したいと思いました。 OpenCVのインストール OpenCV 3.0で入った関数を使いたいので記事を書いた時点で最新版のOpenCV 3.1をビルドしてインストールします。 環境はUbuntu 15.10で、基的にInstallation in LinuxOpenCV 2.4.13.0 documentationに従います。 sudo apt-get install build-essential sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev wge

    画像処理で大腸菌のコロニー数を数えたかった話 - kivantium活動日記
  • 画像内から検出した顔領域をImageMagickで固定サイズに切り出す - すぎゃーんメモ

    TensorFlowでのDeep Learningによるアイドルの顔識別 のためのデータ作成 - すぎゃーんメモ の記事で書いているけれど、学習用データとして使うために収集した画像から「顔の領域」だけを切り出して「固定サイズ」(112x112など)に切り出す必要があって。 以前にも書いたけど、自撮り画像はけっこう顔が傾いた状態で写っているものが多いので、それも検出できるようにしたりしている。 Heroku + OpenCVで簡易顔検出API - すぎゃーんメモ で、せっかく傾きの角度も含めて検出できるならそのぶんを補正して回転加工して切り出すようにしていて。 …というのを RMagick のRVGを使ってcanvasっぽい感じでどやこや書いていたのだけど、どうも使っているImageMagickのバージョンなどの影響もあるのかもしれないけど #destroy!とか明示的に呼んでるはずなのにメ

    画像内から検出した顔領域をImageMagickで固定サイズに切り出す - すぎゃーんメモ
  • 初めてのOpenCV開発 ― highgui/imgcodecs/videoioモジュール【OpenCV 3.1.0】 - Build Insider

    第6回 初めてのOpenCV開発 ― highgui/imgcodecs/videoioモジュール【OpenCV 3.1.0】:OpenCV入門【3.0対応】(1/2 ページ) OpenCVのhighgui、imgcodecs、videoioという3つのモジュールの概要を解説。GUI機能、画像ファイル/動画ファイルの入出力機能、カメラキャプチャ機能などのAPIと、その基的な使い方を説明する。

    初めてのOpenCV開発 ― highgui/imgcodecs/videoioモジュール【OpenCV 3.1.0】 - Build Insider
  • OpenCV.jp : OpenCV逆引きリファレンス — OpenCV-CookBook

    OpenCV.jp : OpenCV逆引きリファレンス¶ 基的に OpenCV (と依存ライブラリ),および標準ライブラリ以外は使用しません. OpenCVはEigenなしでも利用できますが,このサンプルの中にはEigen必須のものもあります. また,2.4.0以降に導入された書式には一部対応しておらず,古い書き方で書かれているサンプルもあります. 指摘や訂正,リクエストなどは OpenCV.jp か, @idojun (Twitter) まで. OpenCV 2.4.0 対応:

  • サイゼリヤの間違い探しが難しすぎたので大人の力で解決した

    こんにちは。河です。 僕はサイゼリヤに行くとまずキッズメニューの間違い探しを解くんですが、 今回は難しすぎたので、大人の力(=画像処理)で解決することにしました。 2014年9月版。みんなもやってみよう! (以下、間違い探しの答えが出てきます。見たくない人は↑の画像で頑張ってから読もう。) やり方 いろいろ書いてますが、左面と右面の違う部分を色の差分から見つけてるだけです。 紙の歪みを吸収するために、少しややこしいことをしてます。 (1) 間違い探しページの写真を撮る ↑の写真です。普通にiPhoneで撮りました。 (2) ページ領域を抽出する 画像からページの部分を見つける必要があります。 今回は面倒なので、左側は手作業で指定しました。 角を手作業でタグ付けして・・・ こっちは手作業。 射影変換で台形補正します。OpenCVならWarpPerspectiveです。 台形補正しても、紙が

    サイゼリヤの間違い探しが難しすぎたので大人の力で解決した
  • 第1回 OpenCVとは? 最新3.0の新機能概要とモジュール構成

    ご注意:記事は、@IT/Deep Insider編集部(デジタルアドバンテージ社)が「www.buildinsider.net」というサイトから、内容を改変することなく、そのまま「@IT」へと転載したものです。このため用字用語の統一ルールなどは@ITのそれとは一致しません。あらかじめご了承ください。 1. OpenCV 1.1 OpenCVとは OpenCV(正式名称: Open Source Computer Vision Library)は、オープンソースのコンピューター・ビジョン・ライブラリです。コンピューターで画像や動画を処理するのに必要な、さまざま機能が実装されており、BSDライセンスで配布されていることから学術用途だけでなく商用目的でも利用できます。加えて、マルチプラットフォーム対応されているため、幅広い場面で利用されていることが特徴です。 OpenCVは、Intelで開発さ

    第1回 OpenCVとは? 最新3.0の新機能概要とモジュール構成
  • 画像処理でできること

    連載では、製造現場で用いられる画像処理技術にフォーカスし、その基礎・概要から、トレンド、導入事例に至るまでを詳しく紹介していきます。 製造現場における画像処理技術とは何か? 連載を通じ、その特徴やメリット、導入時のポイントなどをきちんと理解し、生産性向上に役立てていきましょう。連載第2回のテーマは「画像処理でできること」です。 画像処理で何ができるのか「GIGI」 画像処理で何ができるのかを説明する際、「GIGI」というキーワードをよく用います。これは「Guidance(ガイダンス)」「Inspection(インスペクション)」「Gauge(ゲージ)」「Indentify(アイデンティファイ)」の頭文字を並べたものです。 今回は、画像処理の利用が最も盛んな工場での製造工程を例に、画像処理で何ができるのかを、これらキーワード(GIGI)に沿って説明していきます。 G:Guidance(ガ