タグ

2015年3月11日のブックマーク (2件)

  • git diff で Office ファイルの差分を見る - Qiita

    入れたくないとは思っていても、止むに止まれぬ事情で Word, Excel, PowerPoint などのファイルを git レポジトリの中で管理することはありませんか?この記事では、Mac で Office ファイルの diff を取る方法を紹介します。Linux でも多分動くはず。 textconv 普通、バイナリファイルを git diff しても、変更内容がわかりません。ところが、git には textconv という、バイナリファイル(別にバイナリじゃなくてもいいんですが)をコマンドに渡した結果を diff に使う機能があります。ドキュメントには、JPEG の Exif 情報の diff を取る例等が載っています。 Office ファイルからのテキスト抽出 では、Office ファイルからテキストを抽出するにはどうすればいいでしょう?Windows の msysgit には as

    git diff で Office ファイルの差分を見る - Qiita
    labduck
    labduck 2015/03/11
    Apache Tikaがよさげ
  • MS Wordで書かれた原稿をテキストファイルでGit管理する - Fuzoku実践入門ブログ

    MS Wordで書かれた原稿を電子書籍化する作業を行ったのですが、個人的には使い慣れたRe:VIEWで管理したいものです。 そこで、MS Wordをテキストファイル化してRe:VIEWファイルに書き換えることにしました。 docx2txtを使ってMS Wordをプレーンテキストに変換する ワードファイルのテキストをコピペしてテキストファイルに置き換えるのは流石に面倒ですし、ヒューマンエラーも発生しそうです。 そこで、何か良い方法はないかと思って、おもむろにGoogleで『docx2txt』と検索してみると、まったく同じ名前のソフトウェアを発見することができました。 Docx to Text convertor ページはややレトロですが、ツール自体はメンテナンスもされているようで、これを導入することにしました。 リポジトリ作成 まずはリポジトリの作成です。とりあえず、次のようなファイル配置を

    MS Wordで書かれた原稿をテキストファイルでGit管理する - Fuzoku実践入門ブログ