xiaodongのブックマーク - はてなブックマーク

（JP2対応）シンプルなSSIM計算ツールを作ってみました - 電子化

本日のお題：シンプルにSSIMを計算してみよう過去3回*1、SSIMの計算ツール（ssim.exe）と、それを使ったバッチ処理の方法を、具体的に提示しておいたわけですが、もっと、お手軽なツールを作ってみました。起動させると、こんなの出てきて、四角の部分に、画像を2つ、放り込むだけで、あらま、不思議、SSIMが計算されます、というもの。お手軽なので、以下の点でも、実験してみてください。今年の電子化検定に出ますよ。まるっきし同じ画像は、本当にSSIMが1.0000になるのか？画像の順番を入れ替えると、SSIMの値は変わるのか？どんな場合に、マイナスのSSIMが出てくるのか？果たして、-1.000というのは可能か？こちらからダウンロードできます。（先着40名*2） http://tinyurl.com/249gwzy (お使いのPCによっては、Microsoft .NET Fr

xiaodong 2010/07/21

リンク

SSIMに関する誤解 - 解決案 - - 電子化

本日のお題：デフォルトはssim.m、それ以外なら「主観評価との相関」を提示せよ前回、お伝えしたとおり、私の今の心境は、今、日本で進行中の大型電子化プロジェクトにおいて、SSIMの使われ方が間違っているんじゃないか、そもそもSSIMを誤解しているんじゃないか、と危惧しています。 http://d.hatena.ne.jp/denshikA/20100624 でも、危惧してるだけじゃ、無責任な万年野党と何ら変わりませんね。なので、現状を踏まえて、どうすれば良いのか考えてみたいと思います。おそらく、電子化プロジェクトの発注側ないし監理側は、「SSIMを測定して検査するツール」を持っているはずです。*1 なので、その検査ツールのSSIM計算部分*2のプログラム・ソースを公開するべきだと思います。もし、検査ツールの開発元がソース公開を拒否した場合*3、そのツールの採用を中止するべきだと思

xiaodong 2010/06/27

リンク

SSIMに関する誤解 - 電子化

本日のお題：Different settings will produce different SSIM results. 私の思い違いだと良いんですが、今、日本で進行中の大型電子化プロジェクトにおいて、SSIMの使われ方が間違っているんじゃないか、そもそもSSIMを誤解しているんじゃないか、と危惧しています。昨年9月に書いたように、状況としては、こんな感じですね。 [2009年]に入ってから、私のところに、「SSIMって何ですか」という質問が、頻繁に届くようになりました。理由は、いろんな公共機関が大規模な電子化プロジェクトの予算をつけて、画像のフォーマットとして、JPEG 2000にすること、なおかつ、 SSIMの値を一定水準以上にすることという指定があったからです。 http://d.hatena.ne.jp/denshikA/20090921 そして、今年2月に、日本の電子化業

xiaodong 2010/06/26

「具体的な計算式を提示しなければ、意味のあるSSIMを計算することはできない」

リンク

JPEG2000実習　各レイヤーのPSNR確認編　（JP2デコーダーの登場） - 電子化

本日のお題：本当に指定したPSNRでレイヤーができているのか、検査しましょうさて、前回から、中級編が開始しています。初級編は単に変換をしてきたのですが、中級編では変換後のファイルを検査して、変換をコントロールしていく予定です。すでに、「OpenJPEGを使って変換できるもんね」という方が対象です。まだ、よく分からない方は、http://d.hatena.ne.jp/denshikA/20100602からスタートしてみてください。前回の復習ですが、もし仮に、「PSNRが30、31、32、33、34、35のレイヤーで構成されたJP2を作成せよ」という指示があった場合、 C:\image_to_j2k.exe -i C:\test.tif -o C:\aaaaaa.jp2 -q 30,31,32,33,34,35 というのでOKでしたね。もし忘れてしまった方は、http://d.hatena

xiaodong 2010/06/14

リンク

JPEG2000実習　PSNR編　（ImageMagickの登場） - 電子化

本日のお題：レイヤーをPSNRで指定して、ImageMagickで検査しましょうさて、今日から、中級編です。初級編は単に変換をしてきたのですが、中級編では変換後のファイルを検査して、変換をコントロールしていきましょう。すでに、「OpenJPEGを使って変換できるもんね」という方が対象です。まだ、よく分からない方は、http://d.hatena.ne.jp/denshikA/20100602からスタートしてみてください。これまで説明してきたとおり、OpenJPEGのレイヤー指定は、こんな感じでしたね。 C:\image_to_j2k.exe -i C:\test.tif -o C:\aaa.jp2 -r 50,20,10 通常、OpenJPEGにおいてレイヤーは圧縮率（ビットレートと言っても同じですね*1。）で指定します。ところが、もうひとつ方法がありまして、そちらをご紹介します。こ

xiaodong 2010/06/12

リンク

JPEG2000実習　ビットレート編 - 電子化

本日のお題：ビットレートと圧縮率は、コインの裏表さて、今日は、かなり簡潔に行きます*1。最近の日本における大規模電子化プロジェクトは、JPEG2000のレイヤーを、ビットレートで指定することが多いですね。例えば、ビットレート0.08にしなさいビットレート0.20にしなさい*2 ビットレート0.24にしなさいなど。ところが、これまでに見てきたように、OpenJPEGでは、各レイヤーの指定を圧縮率で指示します。例えば、http://d.hatena.ne.jp/denshikA/20100604で見たように、 C:\image_to_j2k.exe -i C:\test.tif -o C:\aaa.jp2 -r 50,20,10 という場合、「50分の1に圧縮したレイヤーと、20分の1に圧縮したレイヤーと、10分の1に圧縮したレイヤーを作成してください」ということでしたね。はて

xiaodong 2010/06/10

リンク

JPEG2000実習　ロスレス/ロッシー編　その1 - 電子化

本日のお題：ロスレス/ロッシー境界線前々回（http://d.hatena.ne.jp/denshikA/20100602）、JPEG2000の変換について、実習できる環境をご紹介しました。ご自分で変換してみると、よりよく理解できるはずなので、時間の許す限り、やってみてください。*1 いきなり、コマンドプロンプトを開いて、OpenJPEGで以下の変換をしてみましょう。 C:\image_to_j2k.exe -i C:\test.tif -o C:\lossless.jp2 -r 1 前回（http://d.hatena.ne.jp/denshikA/20100604）説明したとおり、「-r 1」というのは、「1/1に圧縮する」ということなので、つまり、直訳すると「圧縮しないでね」という意味になりそうですね。結果を見てみると、という感じで、予想に反して、おおよそ1/5（≒ 10,67

xiaodong 2010/06/07

リンク

JPEG2000実習　レイヤー編 - 電子化

本日のお題：JPEG 2000の「レイヤー」は、「領地の分け前」のことなんです。前回（http://d.hatena.ne.jp/denshikA/20100602）、JPEG2000の変換について、実習できる環境をご紹介しました。ご自分で変換してみると、よりよく理解できるはずなので、時間の許す限り、やってみてください。*1 前にJPEG 2000についてお話した時（http://d.hatena.ne.jp/denshikA/20091014）、今回は、レイヤーに注目してみたのですが、レイヤーというのは、名称が良くない。レイヤーと聞くと、こんなものを連想してしまいます。ところが、JPEG 2000で言うところのレイヤーというのは、こういう「物理的な積み重ね」ではなくて、「切れば切るほど、画質が鮮明になっていく特殊な金太郎飴」みたいなものです。なので、レイヤーという言葉にダマされない

xiaodong 2010/06/04

リンク

JPEG2000実習　準備編 - 電子化

本日のお題：JPEG 2000の環境を揃えましょう。最近、JPEG2000の変換について、質問をいただく機会が多くなってきましたので、しばらく、JPEG2000の変換について、実例をお見せしていこうと思います。自分でやってみる、というのが一番分かりやすいです。 JPEG2000の変換ツールは、OpenJPEG*1というフリーのソフトを使いましょう。こちらに置きましたので、ダウンロードして、とりあえず、Cドライブ直下にでも入れてみてください。をクリックすると、ダウンロード開始するらしいです。*2 image_to_j2k.exe 次に、TIFFのファイルを一つ用意して、先ほどと同じように、Cドライブ直下にでも入れてみてください。こちらに、テスト画像も用意しておきました。 test.tif こんな感じになりましたか？そしたら、コマンドプロンプトを開いて、 C:\image_to_j2k.

xiaodong 2010/06/02

リンク

リボン・スキャニングのまとめ - 電子化

最後のまとめとして、リボン・スキャニング技術を採用している、実際のスキャナーを見てみましょう。各メーカーの宣伝文句を見てみると、これまでに解説しておいたことが声高に叫ばれているだけなので、あー、あのことね、とお分かりいただけると思います。まず、Sunrise（サンライズ）社では、リボン・スキャニングのことをReelScanと呼んでいます。 ReelScan allows the operator to change or delete single poorly captured images through a very user-friendly segmenter module, without having to go through the whole re-scanning process. http://www.sunriseimaging.com/reelscanpr.h

xiaodong 2010/06/01

リンク

パレート法則とリボン・スキャニング - 電子化

本日のお題：マイクロフィルムの電子化（スキャン）におけるいびつなコスト構造を理解しましょう。 *1 パレート法則とは、おおまかに言って、 20%のコストをかけたものが80%の利益を生み、80%のコストをかけたものが20%の利益しか生まないということですね。(wikipedia:パレートの法則) マイクロフィルムのスキャンに関しても、パレート法則が有効かもしれません。マイクロフィルムをロール1本スキャナにかけると、ほとんど全部のコマをちゃんと検出していきます。感覚として、99%〜99.9%は成功するでしょう。かなり高い確率なのね、と思うかもしれません。ところが、「99%〜99.9%成功」というのは、「0.1%〜1%の検出ミス」を意味します。1ロールに2400コマくらい撮影されているとすれば、少なくて2コマくらいの検出ミスで、多ければ20コマくらいですね。ここで、リボン・スキャニング以

xiaodong 2010/05/31

リンク

リボン・スキャニングとは何か？その3 - 電子化

本日のお題：　VHSの時代を思い出して！前々回（http://d.hatena.ne.jp/denshikA/20100517）、リボン・スキャニングという「（自称）超マイナーでありながら、メジャー級の進歩」を紹介し、前回（http://d.hatena.ne.jp/denshikA/20100518）、コマの自動検出について、マイクロフィルムを電子化していくとき、白黒のグラフをもとに、コマを検出し、自動的に切り抜いていくことが理論的に可能なことを説明し、ところが、「理論的に可能」なことは、たいてい、現場では通用しません。という、ありきたりな流れですね。流れについてけてないな、と思う方は、http://d.hatena.ne.jp/denshikA/20100517から始めてください。そこで、本日、現場ではどんなことになるのか、ということを説明していきましょう。ただし、話を分か

xiaodong 2010/05/20

頭出し

リンク

リボン・スキャニングとは何か？その２ - 電子化

本日のお題：　マイクロフィルムのコマ検出前回、リボン・スキャニングという「超マイナーでありながら、メジャー級の進歩」と、私が勝手に思い込んでいるものを紹介しました。そして、話を聞いただけだと、「なんだ、たいしたことないな」と思うかもしれませんが、この技術が出現する前に、マイクロフィルムがどうやってスキャンされていたのか、ということを知ると、「でら便利になったじゃんね」と思うはずです。 http://d.hatena.ne.jp/denshikA/20100517 という流れですね。流れについてけてないな、と思う方は、http://d.hatena.ne.jp/denshikA/20100517から始めてください。今日は、ちょっとだけ、技術的な「寄り道」をします。マイクロフィルムというのは、幅16mmとか35mmのフィルムの中に、こんな感じで書類などが撮影されているわけです。 htt

xiaodong 2010/05/19

]

リンク

リボン・スキャニングとは何か？ - 電子化

さて、このへんで再び、新聞電子化の現場をご紹介しましょう。本日の題材は、こちらのビデオ*1です。以前、ちょろっとご紹介したように、書籍や新聞の電子化プロジェクトは、すでにマイクロフィルム化されている場合はマイクロフィルムから電子化し、マイクロフィルムが無い場合は、紙面[ないしは原本]を直接電子化していきます。 http://d.hatena.ne.jp/denshikA/20090903 マイクロフィルムから電子化したほうが、数段、楽チンだからです。その「マイクロフィルムから電子化」について、ちょっと前に、地味に、大幅な技術的な進歩があったので、ご紹介しておきましょう*2。その名は、「リボン・スキャニング」です。その他にも、別称がいくつか存在していますが、おそらく、「リボン・スキャニング」が一番通じると思います。「リボン・スキャニング」というのは、マイクロフィルムのロール1本ま

xiaodong 2010/05/19

]

リンク

コンピュータに画像はどう見えるのか？　その4　傾き補正編 - 電子化

本日のお題画像： *1 非常に分かりにくいのですが、お題画像の左側、この画像、左に0.8度くらい傾いています。ウソだとお思いなら、分度器で測ってみてください。大量のスキャン画像を処理する場合、その都度、分度器で測定するわけには行きません。そこで登場するのが、今までに何度か登場しているHough変換（ハフへんかん）です。すでに、http://d.hatena.ne.jp/denshikA/20100420で確認したとおり、「赤枠内の交差点の位置だけで、緑枠内に線が、どのあたりに、どんな傾きであるのか、分かってしまう」わけです。今日は、傾きに注目してみましょう。とりあえず、以下の4つを見てください。うすうすお分かりのように、緑枠の縦っぽい線が左に45度づつ傾くと、赤枠内の交差点が右に1/4づつ進みます。つまり、赤枠内の横軸は、ゼロから180までをあらわしていて、交差点の位置から、

xiaodong 2010/04/22

Hough変換

リンク

コンピュータに画像はどう見えるのか？　その3　書籍電子化編 - 電子化

（予備知識） http://d.hatena.ne.jp/denshikA/20100419 http://d.hatena.ne.jp/denshikA/20100420 （本題）*1 *1:http://www.archive.org/details/javaseinegestalt02jungより画像拝借

xiaodong 2010/04/22

リンク

大容量ファイルSSIM縛りJP2変換に関する雑感 - 電子化

おそらく、最初で最後でしょうが、雑感（私見）を述べてみようと思います。最近、「SSIM　JPEG2000」で検索する人が増えているようです。（と言っても、マニアな領域の話ですので、たかが知れてて、AKB48全員よりも少ないでしょう、きっと）その理由は明らかなのですが、「SSIMとは何か？　その1」でも書いたように、いろんな公共機関が大規模な電子化プロジェクトの予算をつけて、画像のフォーマットとして、JPEG 2000にすること、なおかつ、 SSIMの値を一定水準以上にすることという指定があったからです。これまでも、JPEG 2000を採用しているプロジェクトはありました。しかし、これまでのプロジェクトは、「PSNRの値を一定水準以上にすること」という指定でした。それが今年[2009年ですね]あたりから、PSNRではなく、SSIMを基準とするようになってきた、ということです。 h

xiaodong 2010/04/10

「「電子化にまつわる全工程に関する深い理解」を持ったパートナー」

digitization

リンク

なんでSSIMの計算では、ボケ画像を使うでしょうか？ - 電子化

本日のお題画像： http://cvcl.mit.edu/hybrid_gallery/smile_angry.html お題画像を見てください。ずいぶんと古い話ですが、かつて、この画像が話題になったのを覚えてますか？*1 目を細めてみたり、パソコンの画面から少し離れたところから見てみると、「状況が変わる」というトリック画像です。普通に見ると、左にちょっと怒った男性、右に普通にしてる女性がいるのですが、目を細めると、左右が入れ替わり、左に女性、右に男性となるわけです。このトリックのタネについて、こちらの論文（http://cvcl.mit.edu/Papers/Schyns-Oliva99.pdf）を読むと分かるのですが、「高周波画像と低周波画像を合成している」ということです。簡単に説明しておきますと、高周波というのは「よーく見ないと見えないもの」で、逆に低周波というのは「ボケーっと

xiaodong 2010/03/07

「高周波というのは「よーく見ないと見えないもの」で、逆に低周波というのは「ボケーっと見てると見えてるもの」です。」サンプル画像におどろき。

digitization

リンク

OWRから、再び、OCRへ - 電子化

本日のお題：所信貫徹前回、最近のOCRというのは、実はOWRであることを説明しました。ところが、今日は、最近のOCRというのは、実はOWRであるんだけど、さらに、もう一歩進んで、OCRに回帰しているんだよ、という点を見ていきましょう。さて、ちょっと離れた場所からスタートしましょう。「所信貫徹*1」というキーワードで、Googleに聞いてみましょう。という感じで、「もしかして、あなた、初志貫徹のこと言いたいの？」と見透かしてきます。 Googleは、「初志貫徹」という言葉は、「初心貫徹」や「所信貫徹」などと、よく混同されるということをご存知です。賢いですね*2。このような、よく混同（Confusion）される単語などを関係付けておくものとして、Confusion Matrix（コンフュージョン・マトリックス）という表（Matrix）があります。 Googleが持っているConf

xiaodong 2010/01/16

"Confusion Matrix"をふやせば精度があがるのかな。／「第５章　周囲からのサボートと社会的適応能力との関連(川原誠司)」の「サボート」もなんとなくあやしい。

リンク

OCRからOWRへ - 電子化

本日のお題： wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、本名、Optical Character Recognitionですので、その名前が示すとおり、文字（Character）単位の認識（Recognition）をしていきます。ところが、こんなことを額面どおりに行っているソフトは、おもちゃOCRだけです。ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて、Optical Word Recognitionという感じで、単語（Word）単位の認識（Recognition）をしていきます。分かりやすくするために、例で見て行きましょう。前（http://d.hatena.ne.jp/denshikA/20091010）にも書きましたが、OCRというのは、EとB、CとO

xiaodong 2010/01/10

日本語の場合は単語の認識はどうなっているのだろう。

リンク

はてなブックマーク

タグ

ブックマーク / denshika.hatenadiary.org (45)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス