[B! 画像処理] [6ページ] otori334のブックマーク

otori334 id:otori334

画像処理に関するotori334のブックマーク (224)

効率的なミサイル迎撃用のAIを開発する研究者が「トンボの脳」をコピーする意味とは？
AIと聞くと「人間の脳を模倣したもの、あるいは人間の脳を上回る性能を持つもの」という印象を持つ人も多いかもしれません。しかし、軍事科学や安全保障の研究を行うアメリカのサンディア国立研究所に勤めるフランシス・チャンス博士は、人間の脳ではなく「トンボの脳」をモデルにしたAIの開発を行っているとのことです。 Fast, Efficient Neural Networks Copy Dragonfly Brains - IEEE Spectrum https://spectrum.ieee.org/fast-efficient-neural-networks-copy-dragonfly-brains 人間の脳には全体で860億個もの神経細胞(ニューロン)があるといわれており、高度な認知能力を必要とするさまざまなタスクを実現しています。一方、昆虫が持つニューロンはせいぜい数十万～100万個程度です
otori334 2021/08/10
認知

画像処理

制御

生命科学
リンク
ステガノグラフィーの解析について
この解説についてこの解説は、当ソフトウェア『うさみみハリケーン』に付属する汎用ファイルアナライザ「青い空を見上げればいつもそこに白い猫」が実装している、「ステガノグラフィー解析機能」の活用補助を目的として執筆しました。同機能は、特に情報セキュリティにおける、コンピュータセキュリティ技術を競う競技であるCTF(Capture The Flag)での使用を想定しています。また、同機能は、画像ステガノグラフィーの解析ツール「Stegsolve」の互換機能をベースとして、色々な機能拡張を行い、さらに「青い空を見上げればいつもそこに白い猫」に実装された、「文字コード別の文字列抽出」、「バイナリデータの視覚化表示」、「ファイル・データ抽出」および「YARAルールでスキャン」など各種機能との連携を図る形で実装しました。なお、上記ステガノグラフィー解析機能は、すでに画像ファイルへ埋め込まれた各種データ
otori334 2021/08/10
画像処理

セキュリティ

混沌
リンク
HTMLファイルの中に画像を埋め込んで表示させる方法 [ホームページ作成] All About
ウェブページ内に画像を表示する際、一般的にはHTMLファイルと画像ファイルは別々に存在します。例えば、index.html ファイル内に記述されたHTMLソースから画像として image.png ファイルが指定されている場合は、index.html と image.png は別々に存在するファイルです。当たり前ですね。そもそも、HTMLファイルはテキストデータなのに対して、PNGやJPEGなどの画像ファイルはバイナリデータです。ですから、画像とHTMLを1ファイルにまとめることはできなさそうに思えます。 ※テキストデータ：人間に読める文字だけで構成されたデータ。 ※バイナリデータ：人間用ではない(画面に表示できない)文字などを含んだデータ。
otori334 2021/08/10
画像処理

Web
リンク
ワープロ専用機の拡大処理を再現したフォント「ワープロ明朝」
ワープロ専用機の拡大処理を再現したフォント「ワープロ明朝」「ワープロ明朝」は、1980年代〜90年代初めのワープロ専用機などで使われていた、ビットマップフォントの拡大処理を再現したフォントです。ワープロ専用機も後期にはアウトラインフォントが搭載されて綺麗な拡大が可能になりましたが、それ以前は大きな文字を印刷するときにもビットマップフォントを拡大して使っていました。そのまま拡大するとギザギザになってしまうので、階段状になったドットを斜めの線で補間する処理が施されて独特な見た目になっていました。「ワープロ明朝」は24ドットの明朝体ビットマップフォント jiskan24 にこの補間処理を行い、アウトラインフォント化したものです。使用例張り紙に:
otori334 2021/08/08
フォント

電卓

画像処理
リンク
網膜における視覚情報処理のメカニズム
otori334 2021/07/30
網膜における視覚情報処理のメカニズム

光

生命科学

認知

画像処理

信号処理

PDF
リンク
写真からアニメ背景を生成するAI『Anime Art Painter』| cre8tiveAI
アニメ背景を創る Anime Art Painterとは？Anime Art Painter（アニメ背景生成AI）とは、写真をアニメ風に変換するAIです。一般的に、アニメは1話あたり200枚〜300枚の美術背景が使われています。短い納期の中でクオリティの高い背景を制作する必要があるため大変な仕事です。 Anime Art Painter は、アップロードするだけでアニメ風の背景に変換できるためアニメ制作を効率化できます。1回の変換で4種類のアウトプットを提供しており、アニメだけでなく広告の素材、挿絵や漫画等、様々な用途でご活用いただけます。様々な種類の写真を精度高くアニメ風に変換できます
otori334 2021/07/30
画像処理
リンク
SVGで「文字を書いていくアニメーション」を作る – コーヒーサーバは香炉である
かきかたプリントメーカーに「書き順アニメーション」という機能を実装した。これを作る際に使ったテクニックを紹介する。スクリプトは不要。純粋なSVGだけで次ようなアニメーションが作れる。 (2021/06/16追記 : アニメーションSVGの貼り過ぎでスマホだとめちゃくちゃ重かったり表示されなかったり遅延が発生したりします。すみません。) SVGに「線を途中まで書く」という機能自体はない。そこでちょっと工夫が必要になる。テクニックの概要はこんな感じだ。「ものすごく荒い破線で線を表示し、破線のオフセットがちょっとずつ変化するようにする」ステップ0 : 破線を使って「書きかけの線」を作るこちらはベジエ曲線1本で作った「の」である。ソリッドな線で表示される。SVGのソースはこんな感じだ。 <?xml version="1.0" encoding="UTF-8" standalone="n
otori334 2021/07/25
画像処理

フォント

G-Code

Web
リンク
音声に合わせ顔の動きを深層学習で作成　Adobeなど「MakeItTalk」開発
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米マサチューセッツ大学アマースト校、米Adobe Research、中国Huya Incによる研究チームが開発した「MakeItTalk」は、音声に合った顔と頭の動きを生成する深層学習フレームワークだ。音声信号と顔の静止画像から、音声と同期した表情と頭部のアニメーションを生成する。実際の顔写真やアニメキャラクター、手描きスケッチまで、さまざまな顔に対応可能だ。
otori334 2021/07/19
音

画像処理

機械学習
リンク
東大、デジカメ画像から植物の3次元形質を測定可能なPythonパッケージ公開
東京大学は6月15日、一般的なデジタルカメラの画像から、鉢植え植物の3次元データを高精度に自動測定するPythonパッケージ（EasyDCP:Easy Dense Cloud Phenotyping）を開発し、公開したと発表した。 EasyDCPを利用した測定の大まかな流れ　資料：東京大学同大学によると、近年は植物の3次元形質を非破壊的に測定するための手法が発展してきているが、既存のシステムは高価であり、大規模な施設や専門的な装置が必要といった理由から、生態学の分野ではそれらのシステムがほとんど用いられてこなかったという。しかし、生態学的研究において草丈、投影葉の面積、草姿など植物の形に関する測定は非常に重要であり、鉢植えの植物を安価で高速に測定するシステムが必要とされていた。そこで同大学は、一般的なデジタルカメラと、市販およびオープンソースのソフトウェアを組み合わせたパイプライン（E
otori334 2021/07/18
画像処理

農業

Python

拡張現実

カメラ
リンク
クロマグラムと和音 – blog｜メディア情報研究室｜村上真研究室｜東洋大学総合情報学部
目的音楽データは和音やコードと言われる心地良いいくつかの音の組み合わせで構成されることが多い．ここでは，和音と和音を表現するときに使用されることが多いクロマグラムについて学ぶ．説明長三和音ピアノでC3から1オクターブ上のC4までの13音「C3 C#3 D3 D#3 E3 F3 F#3 G3 G#3 A3 A#3 B3 C3」を順に弾いたオーディオデータにConstant-Q変換をかけ，パワースペクトログラムを表示してみよう．実行すると以下のように表示され，例えば最初の1秒でC3の音を弾いている区間では，C3の2倍・3倍・4倍…の周波数成分が強く現れていることがわかる．これは調波構造や倍音構造と呼ばれる特徴で，弦楽器や管楽器で弾いた音に現れる特徴である． C3の2倍の周波数の音は1オクターブ上のC4であり，4倍の周波数の音は2オクターブ上のC5であることは自明である．ここではC3の
otori334 2021/07/17
信号処理

音

画像処理

Python
リンク
離散コサイン変換 - Wikipedia
二次元DCTとDFTとの比較。左はスペクトル、右はヒストグラム。低周波域での相違を示すため、スペクトルは 1/4 だけ示してある。DCTでは、パワーのほとんどが低周波領域に集中していることがわかる。離散コサイン変換（りさんコサインへんかん、英: discrete cosine transf orm、DCT）は、離散信号を周波数領域へ変換する方法の一つである。概要[編集] DCTは、有限数列を、余弦関数数列 cos(nk) を基底とする一次結合（つまり、適切な周波数と振幅のコサインカーブの和）の係数に変換する。余弦関数は実数に対しては実数を返すので、実数列に対してはDCT係数も実数列となる。これは、離散フーリエ変換 (DFT: discrete Fourier transf orm) が、実数に対しても複素数を返す exp(ink) を使うため、実数列に対しても複素数列となるのと大きな違い
otori334 2021/07/09
直流バイアスの拡張 “DCTはy軸で折り返して偶関数化してDFTすることと等価であり、実際にそう計算することが多い。”

信号処理

数学

圧縮

画像処理

音

電気

アルゴリズム
リンク
直流バイアス - Wikipedia
時間領域で周期関数を記述する場合、直流バイアス（直流成分、直流オフセット、直流係数）は波形の平均値である。平均振幅が0の場合、直流オフセットがないということである。直流成分のない波形は、直流バランス（DC-balanced）または直流フリー（DC-free）な波形として知られている[1]。起源[編集] この用語は電子工学の世界において直流電圧を指す言葉に由来する。それに対し、他の様々な非直流周波数は重ね合わせた交流（AC）電圧・電流に類似しており、そのため交流成分もしくは交流係数と呼ばれる。この発想は、あらゆる波形の表現や、JPEGで使われる離散コサイン変換のような2次元変換に拡張されている。応用[編集] 電子増幅回路の設計では、全ての能動素子は信号が印加されていない時に、動作点、定常状態の電流電圧をデバイスに設定するためにバイアシングをしている。例えばバイポーラトランジスタのバイア
otori334 2021/07/09
電気

信号処理

画像処理

通信
リンク
FlashのSelenium対応 - Qiita
目的 Adobe Flashで作成されたサイトのUIの自動テストがしたい. http://www.adobe.com/jp/products/flashplayer.html 主に,Click,Drag & Drop, Double Clickなど. 問題点 Web Browserの自動テスト=Seleniumを使う,という安直な思考でSelenium Pythonを選択する. しかしながら,FlashはHTML上一つのオブジェクトとしてみなされるため,その子供の要素を指定する方法がSeleniumにはない. 解決案 Selenium Web Driver APIにmove_to_element_with_offset(to_element, xoffset, yoffset)というMethodがある.これを利用できないか手順 Flashゲーム・艦隊これくしょんを例にして実装方法を説明す
otori334 2021/07/08
OpenCV

スクレイピング

画像処理
リンク
スナック菓子の袋に反射した光から、周囲の様子を画像で“復元”する：米研究チームが実験に成功
otori334 2021/07/05
光

音

セキュリティ

拡張現実

画像処理
リンク
https://www.jstage.jst.go.jp/article/fss/30/0/30_154/_pdf/-char/ja
otori334 2021/07/05
単眼カメラでの曲面文字情報取得のための断面形状推定による平面化手法の提案

OCR

画像処理

カメラ

本

PDF
リンク
カメラキャリブレーションと3次元再構成 — opencv 2.2 documentation
カメラキャリブレーションと3次元再構成¶ このセクションで述べる関数は，いわゆるピンホールカメラモデルを取り扱います．つまりこのモデルでは，3次元座点を透視投影変換を用いて画像平面に射影することで，シーンのビューが構成されています．ここではワールド座標系の3次元座標を表しは画像平面に投影された点の座標を表します．は，カメラ行列，またはカメラの内部パラメータ行列と呼ばれます．は主点（通常は画像中心），はピクセル単位で表される焦点距離です．したがって，あるファクタによってカメラ画像がスケーリングされている場合，このすべてのパラメータを同じファクタでスケーリング（それぞれが，拡大または縮小）する必要があります．内部パラメータ行列はビューに依存しないので，一度推定すれば（ズームレンズの場合）焦点距離を固定している限りは繰返し使用することができます．並進-回転の同次変換行列である
otori334 2021/07/05
OpenCV

カメラ

画像処理

C++
リンク
Harrisコーナー検出 — OpenCV-Python Tutorials 1 documentation
We Harrisのコーナー検出の背景にある概念を理解します．以下の関数の使い方を学びます: cv2.cornerHarris(), cv2.cornerSubPix() 理論¶ 前チュートリアルでコーナーとは全方向に対して画素値の大きな変化が観測される領域であることを学びました．初期のComputer Visionにおけるコーナー検出の試みとして Chris Harris と Mike Stephens が A Combined Corner and Edge Detector という論文で提案したHarrisのコーナー検出と呼ばれる方法があります．Harrisらはこの単純なアイディアを数式で表現しました．基本的には全方向に対して画素位置の移動量に対する画素値の違いを見つけるわけです．以下のように表現できます．窓関数は矩形窓か画素に対して重み付けをするガウシアン窓を使います．コー
otori334 2021/07/05
画像処理

OpenCV

Python
リンク
３０．ディープラーニングでノイズを消してみよう - keep learning blog（キープラーニングブログ）
――科学者とは、自然のひみつと美しさを探し求めるおとぎの国の旅人です。それは大変おもしろく、夢のある楽しい仕事なんですよ。―― マリア・スクウォドフスカ・キュリーディープラーニングでノイズを消してみよう論文の概要 U-Netとは U-Netのアレンジ Pythonで実装ディープラーニングでノイズを消してみようすっかり季節が初夏の陽気になってきたと思っていたら、暦はもう6月になっていました。キュリー夫人の言う「おとぎの国」という表現がぴったりのデンマーク生活も、そろそろ終わりを告げようとしています。昨年7月にデンマークの土を踏んでから約1年間、短いようでとても長かったです。西洋のことわざで、「ロバが旅に出かけたところで、馬になって帰ってくるわけではない」という言葉があります。私はポニーくらいにはなれたでしょうか。デンマーク生活で印象に残っていることはいくつかあります。そこに住む人
otori334 2021/07/05
“2015年頃に電子顕微鏡画像から細胞などの特定箇所を検出する（Segmentation）用途で開発された、U-Netという比較的シンプルな畳み込みニューラルネットワーク（CNN：Convolutional Neural Network）を採用”

音源分離

アルゴリズム

信号処理

生命科学

画像処理

Python
リンク
Python: LibROSA で調波打楽器音分離 (HPSS) - Wizard Notes
調波打楽器音分離とは？一般的な楽曲では、様々な楽器音が含まれています。そのため、元の楽曲信号から直接、音楽的な情報（例：コード進行）を分析するのは計算機ではなかなか難しいです*1。そこで、分析の前処理として、打楽器の音と非打楽器（調波楽器）の音を分離する調波打楽器音分離 (HPSS: Hermonic/Percussive Source Seperation) *2が良く使われています。この記事では、HPSSの概要とPython (LibROSA) のコードの解説します。調波打楽器音分離とは？調波打楽器音分離のアイディアアルゴリズムの設計非負値行列因子分解＋基底クラスタリング最適化問題（行列因子分解）として解く深層学習を使った手法メディアンフィルタベースの手法 LibROSAにおける調波打楽器分離（HPSS）の実装使い方実装の詳細 librosa.effect
otori334 2021/07/04
音源分離

最適化

Python

音

楽器

信号処理

画像処理
リンク
折り返し雑音 - Wikipedia
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。（このテンプレートの使い方）出典検索?: "折り返し雑音" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL（2022年12月）正しく標本化されたレンガの壁の画像空間折り返しひずみ（モアレ）が生じている例折り返し雑音（おりかえしざつおん、（英: folding noise）またはエイリアシング（英: aliasing）とは、統計学や信号処理やコンピュータグラフィックスなどの分野において、異なる連続信号が標本化によって区別できなくなることをいう。エイリアスは、この文脈では「偽信号」と訳される。信号が標本化され再生されたとき、元の信号とエイリアスとが重なって生じる歪みのことを折り返し
otori334 2021/07/03
信号処理

画像処理

音

固体物理

統計
リンク
前のページ 2 3 4 5 6 7 8 9 10 11 次のページ