タグ

ブックマーク / snaka72.hatenadiary.org (2)

  • オライリーのPDF書籍をePubに変換する - 今日もスミマセン。

    なんとなく日PDFをePub化することができたので、その手順をメモっとく。ただし、以下の方法ソースをベタでイジるので万人にはおすすめできない。 大まかな手順は、 Calibre最新版をインストール Calibreの最新ソースを落としてくる poppler(pdftohtmlコマンドが含まれている)の最新版を落としてくる xpdf-japanese 言語サポートパッケージを用意する Calibreのソースを改変、無理やり日語対応させる という感じ 環境は、Mac OS X Snow Leopard 10.6.7 以下、手順の詳細 Calibre最新版をインストール 以下から最新版をダウンロード/インストールする。 calibre - E-book management このときのバージョンは $ calibre --version calibre (calibre 0.7.55) Ca

    オライリーのPDF書籍をePubに変換する - 今日もスミマセン。
    koba04
    koba04 2011/05/03
    気が向いたときにやるかも。
  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
    koba04
    koba04 2010/07/12
  • 1