[B! java][pdf] arc_at_dmzのブックマーク

arc_at_dmz id:arc_at_dmz

javaとpdfに関するarc_at_dmzのブックマーク (2)

Apache PDFBox日本語対応パッチ - atsuoishimoto's diary
Apache PDFBox はPDFファイルの操作や内容の抽出などを行うオープンソースのライブラリで、最初にリリースされてからの歴史も長く、結構メジャーなライブラリである。InfoPileで利用しているApache Tika プロジェクトでも標準のPDF読み込み機能として採用されている。しかし、残念なことにPDFBoxはCJKなテキストをほとんどサポートしておらず、日本語PDFではほとんど使い物にならない。他のPDFライブラリに切り替えるのも手だが、他に日本語が扱えるJava製ライブラリが存在するのかどうか不案内だし、切り替えると Tika まで直しにかからないといけなくなってしまう。というわけで素直にPDFBoxの日本語対応にチャレンジしてみた。PDFとかPostScriptとかあんまり詳しい方ではないけど、なんとかなるだろう。調べてみると、今年の春頃に日本語対応にチャレンジされた方
arc_at_dmz 2011/09/03
java

pdf
リンク
ERIGO4D Link Platform Slot Paling Favorit Terpercaya 2024
Pastikan kamu tidak lewatkan kesempatan untuk bergabung bersama situs ERIGO4D yang menjamin semua member bisa menang hari ini.
arc_at_dmz 2011/09/03
java

pdf
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx