タグ

ブックマーク / haraita9283.blog98.fc2.com (2)

  • OpenOffice.org: バッチ処理で .odt-.doc 相互変換、PDF出力 | anobota

    Ruby 1.8.7 でファイルの行数カウント String#count で改行を数える方法は、 (おそらく)一旦全部読み込むので大きなファイルだとメモリの制約を受ける。 簡単に調べた限りではこの方法は wc -l の出力と同じ。 File#lineno を使う場合は逐次処理なので大きなファイルでも大丈夫。 ファイル数が少ない場合は wc が早いが、 小さなファイルをたくさん調べたい場合は Ruby で読んだ方が速い。 require "benchmark" def lineno_a(path) open(path).each{}.lineno end def lineno_b(path) open(path).read.count("\n") end def lineno_wc(path) `wc -l #{path}`.to_i end def test_lineno(str) pat

  • スキャンした書籍や書類の余白をImageMagickで除去する | anobota

    スキャンした書籍や書類の余白をImageMagickで除去する -trim, -fuzz そういう都合のいいオプションはないものかと調べてみると、 -trim というのが見つかりました。 convert -trim a.png a-out.png a.png a-out.png ただし、 -trim オプションは「角のピクセルと同じ色」を除去するようで、 紙の色ムラ・染みなどノイズが混じっていると上手く除去できません。 convert -trim b.png b-out.png b.png b-out.png convert -trim c.png c-out.png c.png c-out.png そこらへんも適当にうまいことやってくれよーと思うわけですが、 なんと大変都合の良いことに -fuzz というオプションがあるんですね。 -trim に添えて -fuzz 50% などと指定して

  • 1