サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
画力アップ
vision.kuee.kyoto-u.ac.jp
ディジタルフィルタの設計法 0.逆フィルター 1.直線位相FIRフィルタの設計 2.窓関数法によるFIRフィルタの設計 2.5時間領域でのFIRフィルタの設計 3.アナログフィルタを基にした ディジタルIIRフィルタの設計法(I) 4.アナログフィルタを基にした ディジタルIIRフィルタの設計法(II) 5.双2次フィルタ LTI離散時間システムの基礎式の証明 [ ] ) 12 . 4 ( ] [ * ] [ ] [ ] [ ) 11 . 4 ( ] [ ] [ ) 10 . 4 ( ] [ ] [ ] [ ) 9 . 4 ( ] [ ] [ ] [ ] [ と表すことができる。 は 任意の離散時間信号 n h n x k n h k x k n L k x k n k x L n y k n k x n x n x k k k k = − = − = − = −
音声信号の特徴 音声信号は,声帯の振動や摩擦による乱流などの音源信号に, 声道・口腔・鼻腔の形状などによって決まる調音フィルタ が畳み込まれたものであると考えることができる. ケプストラム分析とは, 調音フィルタの振幅伝達特性と音源信号のパワースペクトルでは, 前者が後者に比べて(周波数領域で)滑らかに変化する関数であるという性質を用いて, 両者を分離する信号処理手法である. ケプストラム(cepstrum)とは,スペクトラム(spectrum) のアナグラムによる導出語であり, 音声波形をフーリエ変換して得たパワースペクトルについて, その値の対数をとり,さらに逆フーリエ変換した結果を指す. ケプストラムの変数の次元は時間と同じになるが, これにはケフレンシ(quefrency)という言葉を用いることが多い. (これは周波数(frequency)のアナグラムである.) 一般に,音源信号の
vision.kuee.kyoto-u.ac.jp/~hiroaki
コンピュータビジョン 第11回 オプティカルフロー 担当:川嶋宏彰 講義計画 講義計画 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. Introduction1: 概要(10/9) Introduction2: カメラとレンズ(光学系・撮像素子)(10/16) Geometry1: 座標系(10/23) Geometry2: 投影モデル(10/29) Geometry3: 同次座標,射影幾何(10/30) 同次座標 Geometry4: 射影カメラとアフィンカメラ,視差に基づく立体視(11/12) Geometry5: エピポーラ幾何,ホモグラフィ(11/13) Photometry1: 光源,反射モデル(11/27) Photometry2: 陰影モデルによる形状復元 & Motion予習 (12/4) Motion1: 因子分解法(カメラ
vision.kuee.kyoto-u.ac.jp/~nob
TrueTypeフォントから任意の文字のアウトライン形状を取得し,epsで保存する.TeXと組み合わせると,フォントの見本帳作成などが可能になる. ※数式を正しく表示するには IE6 + MathPlayer プラグインか, Mozilla firefoxなどの Gecko エンジン搭載ブラウザが必要です. なお MathML を両ブラウザ向けに適切に変換するために,ASCIIMathMLに含まれる javascript コードを使用しています. 1 はじめに TrueTypeフォント[1][2][3]からアウトラインを取得し,epsで保存する. 2 アウトライン形状のデータ構造 TrueTypeフォントでは,そのアウトライン形状を2次のBスプライン曲線で表す.一方,Postscript系(Type1フォントなど)では,3次のBezier曲線でアウトライン形状を表現する.またOpenTyp
ユーザ ID およびパスワードを入力してください.教職員等は SPS-ID,学生は ECS-ID をユーザ ID に入力します.それ以外の方は PandA に登録したメールアドレスを入力します.SPS-ID を発行されている教職員は ECS-ID でログインしないで下さい.
vision.kuee.kyoto-u.ac.jp/~yosimoto
の繰り返しです. 画素を直接操作して,図形を描画する例を sample03.cpp にまとめました.がんばって解読してください. $ ./sample03 で,実行できます. 簡単に説明すると,320×240 の画像用のメモリを確保するには IplImage *src = cvCreateImage( cvSize(320,240), IPL_DEPTH_8U, 3); とします. "IPL_DEPTH_8U" と "3" を指定しているので,各画素は 8*3 bits の情報を持 つことができます.各画素の色情報をR,G,Bの3つの成分で表現すると,RGB 成分はそれぞれ 0〜255 の数値で表されることになります. 実際のメモリ上にどのように画素のRGBの情報が格納されるかを図に示します. 画像用のメモリの先頭のアドレスは,IplImage構造体のメンバ変数の imageData
c/c++ 数値計算ライブラリの比較 † 行列やベクトルで書いたアルゴリズムを直感的にコーディングするにはMATLAB/Octaveがいいかと思う でも,外部ライブラリ(デバイスのAPIなども)と共に使うにはやはりCかC++がいいかな MATLAB/Octave用の関数などのバイナリをいちいちコンパイルする手もあるかも知れないが,いっそのことC/C++ベースで. 特にc++だと,行列同士の演算子が定義されており,非常に直感的に(数式のように,もしくはMATLAB/Octaveのように)書けるので便利かも TNT やNumerical recipeもあるが今回は使わない(昔使っていたが最近どう変わったか調べるのも面倒なので) とりあえず以下を候補としてみる GSLも良く使われるので入れておく 結局どれも LAPACK + BLAS(ATLAS BLAS) + alpha(fftw, その他)
動画像からシーン内の移動対象の検出を行う際に用いられる手法の一つとして, 背景差分法が挙げられる.この手法は観測画像と背景画像を比較することで, 簡便に移動物体を検出する手法である.しかし,背景差分法では画像上に現れ る明度の変化をすべて対象として検出するため,画像上の背景領域で明度変化 が起こるような環境では誤検出が生じる.この問題に対し,本研究では,照明 の強度の変化(照明変化)に着目し,照明変化に対して頑健な背景差分につい て検討を行った. 仮に観測画像と背景画像の間で照明の変化に対して不変な特徴が存在すれば, この特徴に差がある部分に移動対象が写されているものと見なすことができる. 本研究では,このように,「照明変化に対して不変な特徴」を基本とした,背 景差分を提案する.尚,本研究では,照明変化に対して不変な特徴として,1) 局所画像のテキスチャパターンの類似性,2)背景画像の照明
これらライブラリがインストールされているかどうかは,RedHat系のlinux で あれば rpm コマンドを使って調べる事ができます. $ rpm -qa | grep motif まず,root以外の自分のアカウントで linux にログインしましょう. そして,自分のホームディレクトリの下に tmp というディレクトリを作ります. 自分のホームディレクトリに移動して $ cd ディレクトリを作成します. $ mkdir tmp 作成したディレクトリに移動します. $ cd tmp 確認は次のコマンドで出来ます. $ pwd
Pointgrey製のIEEE1394カメラ(grasshopper, dragonfly, fleaなど)をLinux上で使う方法について.特にPointgrey特有の機能の使用方法など. 1 目的 Pointgrey製のIEEE1394カメラ(dragonfly, fleaなど)をLinux上で使うには,libdc1394[2], libraw1394[3]を使用して一般的なIIDC 1394-based Digital Camera (DCAM)として使用すれば画像キャプチャなど,基本的操作の上では問題ない. しかしPointgreyカメラ特有の機能,例えば撮影画像の露光開始時刻を取得する機能などを使用するには,もう少し自分でコードを書く必要がある. ここでは,一般的DCAMとして画像をキャプチャするまでの方法と,さらにPointgrey特有の機能を使用する方法について説明する. 2
nVidia製ドライバをLinuxでつかう. いくつかの箇所でDebian GNU/Linuxであることに依存した記述があるが,他のディストリビューションでもちょっとした修正で対応できるだろう. 1 目的 Quadro 2 ProをLinux上で使う. 2 debian パッケージでインストール 2.1 kernel 2.6 & sid kernel 2.6で動作させる方法は,特に2.4の頃と変わらない(1).実際にlinux-2.6.5とsidで行った作業を説明する.コンパイル時に関連するであろうパッケージのバージョンは, kernel-source-2.6.5 2.6.5-1 kernel-package 8.088 nvidia-kernel-source 1.0.5336-6 modutils 2.4.26-1 module-init-tools 3.0-pre10-2 であった.
2.1.1 注意? IllustratorやTgifなどで描いたベクタ画像についても圧縮できた. 32000個の三角形を描画するepsファイルで試すと,1500KBから90KBになった.しかし gzipで540KBにしかならないものが90KBまでなるとは考えにくいのと, gvなどのレンダリングがビットマップで行われていること を考えると, プレビュー画像を用意した上で圧縮した のではなく, 単に低解像度のレンダリングに差し替えられてしまった と考えるのが妥当か? 現バージョン(5.4.8.2)では,eps2,eps3は書き出しのみに対応しているらしい( see man imagemagick ).しかし実際には読み込みもできているようだ・・・ 2.2 Jpeg2000による自然画のロスレス圧縮 Jpeg2000を使うとロスレス圧縮が可能になる(ホントはJpegにもその規格はある). これを
自分のプログラムからGNUPLOTを使うための簡単なクラスをつくる.車輪の再発明そのものなテーマだが,まあ練習ということで. 1 目的 C++からGNUPLOT[1]をつかってグラフを表示したり,それをepsで保存したり. 2 環境 g++とGNUPLOTが必要. 3 方針 とにかくGNUPLOTを起動し,それにコマンドを渡せばよい[2][3][4].これには パイプ経由 一時ファイル+子プロセス の2つの方法が考えられるが,前者は "pause -1"のコマンドが効かない? オプション"-persist"が無い場合,一瞬表示した後すぐに消える "-persist"としてもGNUPLOT本体のプロセスが終わる(?)ので,グラフのマウスによる回転などはできない 後者は "pause -1"は有効 このときグラフのマウスによる回転などはできる 一時ファイルを用意する必要がある と,それぞれ一長
IMAP4クライアントのうち,CRAM-MD5認証に対応しているものは少ない.しかしソースが公開されている場合,若干の修正によって対応させることが可能となる. この文章ではCRAM-MD5認証の手順と,実際の修正作業について説明する. 1 目的 IMAP4クライアントをCRAM-MD5認証に対応させる. 2 CRAM-MD5とは? CRAMとはChallenge-Response Authentication Mechanismの略で,POPにおけるAPOP認証に対応する.これをおおざっぱに説明すると, サーバから送られたその場限りの文字列をMIMEでデコードし,"challenge"を得る "challenge"を鍵としてパスワードをMD5にかけ,"keyed md5 digest"を得る ユーザ名+空白+ "keyed md5 digest"をMIMEでエンコードしてサーバに返す とな
Geomviewという3Dモデルビューワがある.これはもともとUnix上のX11環境で動作し,OOGLと呼ばれるファイル形式によって,点,線,多面体,ベジェ曲面,球,メッシュといったオブジェクトとそれらの任意の組み合わせを表示することができる. 残念ながら現時点ではgeomviewの使い方について説明している日本語の文章が少ないため,Windows上でのコンパイル方法と,使ったことのある範囲内で知っていることをメモしておく. 1 目的 まずはgeomviewをwindows上でコンパイルし,geomview[1]のファイルフォーマットであるGCLやOOGL形式の説明と,geomviewのちょっとした使い方について説明する. なおマニュアル[2][3]を読めばすぐわかることは省く. 2 環境 2.1 windowsの場合 現時点では,windowsネイティブなgeomviewは存在しない.こ
1 DirectX9 のインストール 現在DirectX9 (9.0b)には, オリジナル(2002冬) Summer 2003 Summer 2003 + 10月の更新 の3つのリビジョンというか,インストール状態が存在する.当然,より新しいほうがいいわけだが, AppWizardが生成してくれるサンプルがコンパイルできなかったり, Visual Studio .Net 2003の対応が中途半端だったり と,知らないうちは混乱する. とりあえずVisual Studio .Net 2003で,日本語ドキュメントつきで使えるようにするには, 「Summer 2003 + 10月の更新」という内容のファイル(約180MB)をダウンロードし,インストール. 「DirectX 9.0日本語ドキュメント(2002/12/19)」をインストール. ダウンロードしたものを実行しただけだと,一時ディレク
DisklessなLinuxマシンをつくる.起動スクリプトなど,何カ所かdebianであることに依存している点があるかもしれない.今のところ動作実績はクライアント35台・3年弱(2002/04〜2005/02). 1 目的 DisklessなLinuxマシンをつくる.ここでdisklessであるとは, ハードディスクが不要である ことを指すことが多いが,その目的・メリットは ネットワークブート型:多数のPCを集中管理できる(thin client用) CD / FDブート型:手軽にOSを入れ替えることができる(gateway, router,あるいはデモやレスキュー用ディスクなど) のように, ハードディスクに収まっていたはずのOSをどこから用意するか ということの実現方法に応じて異なる. ここでは前者の"集中管理"を目的として,ネットワークブート型のdiskless linuxを実現する
"windowsのVisual C++環境で使えるフリーで多機能な数値計算クラスライブラリが欲しい".この極めてニッチな要求を満たすため,GNU Octave (Matlabクローン)の計算ルーチンであるliboctaveをVisual C++ .Net (VC7)でコンパイルする. liboctaveとはC++で書かれた数値計算ライブラリであり,そのバックエンドとしてlapack, fftwなどを用いている.つまりこれはlapackなどの有名なライブラリを組み合わせたC++によるラッパーであり,基本的にMatlab相当の機能を持っている. またOctaveのソースにはこれら依存ライブラリのソースが含まれているので単体でビルドする事も可能であるが,SSEや3DNOWのような各CPU固有の命令を用いた高速版( Intel Math Kernel LibraryやAtlasなど)で差し替えて高
プレゼンの用意をしていると,連続画像から動画をつくりたいということがある.windowsではadobe premireなどの各種ソフトウェアによって簡単に実現できるが,linuxや各種unix上でとなると残念ながら選択肢が多いとはいえないし,そのようなノウハウを紹介している文章も現時点では少ない. そこで現時点で使ったことのある,ムービー作成用のツールの使い方をメモしておくことにする. 1 目的 簡単に言うと, 連続画像(連番画像)をムービーにまとめる となる. 2 環境 mencoderはWindows版/ Linux版ともに存在する.mpeg_encodeはUnix版のみ(のはず). 3 MEncoderを使う mplayer[2]にはmencoder[3]というエンコーダが含まれている.これを使うと,mpeg1だけでなくmpeg2, mpeg4(divx), wmvといった各種フォー
1 はじめに 環境はVisual C++ .NET (2000 or 2003) + DirectX SDK 8.1b.VC6でも通用することが多いと思う. 2 printf デバッグ もっとも原始的なデバッグ法はやはりprintfであろう.要するにコードの怪しいところで変数の値をコンソールに書き出すだけである. Unixで開発しているときは自然と端末を使っているため,単にprintf (バッファリングされると困るので実際はfprintf( stderr, ... )だろう)を使うだけだが,WindowsでGUIアプリを開発しているとコンソールが無いためどうしよう…となってしまう. そこで以下の2つ解決策を考えてみる. デバッガに出力する.つまりVisual Studioのデバッグ画面(○○.dllを読み込みました…とか出るウィンドウ)に表示させる.これにはOutputDebugStrin
次のページ
このページを最初にブックマークしてみませんか?
『vision.kuee.kyoto-u.ac.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く