"Text Extraction From Graphical Document Images Using Sparse Representation" という論文をつらつら読んでいたところ,文書画像にあるダイアグラムの文字要素と罫線要素をうまく分離していてスゲー!ちょっとやってみようと思ったんですけど,Curvelet 変換なるものが基盤の理論になっているようで,こいつがなかなか難しい。 日本語の資料がまだ少なくてあたしもさっき知ったばかりなんですけれど,Curvelet 変換というのは,Wavelet 変換と同じマルチスケールな変換のようです。フーリエ変換が,局所的な波を上手く検出できない不便があったのに対して,Wavelet 変換はマザーウェーブレットをスケーリング(拡大・伸縮)することで局所的な波の特性を得ることができたのでした。しかし,Wavelet 変換にも難儀なところがあって