エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
LuceneでPDFBoxを利用する場合のメモ - IkeTの日記
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
LuceneでPDFBoxを利用する場合のメモ - IkeTの日記
Apache Luceneを利用してPDFファイルのインデクシングを行う場合、PDFBoxを利用するのが一番簡単である... Apache Luceneを利用してPDFファイルのインデクシングを行う場合、PDFBoxを利用するのが一番簡単であるが、最新のLuceneに対応するためにはApache Incubatorで開発されている最新のバージョンを使用する必要がある。もちろんの事ながらMavenのリモートリポジトリは公開されていないため、Subversionからソースを取得し、ローカルリポジトリへインストールしなければならない。 他の、PDFライブラリを利用してもよいのだが、単純にコンテンツを抜き出すだけの処理であるため高度な操作は必要ないことや、同じApacheのプロジェクトのため(?)Apache Luceneで利用するためのExtractorが備わっていることなどから、PDFBoxが最適であると判断した。 端末の移項に伴い、もう一度セットアップする機会が生まれたので、ここで手順を残しておく。残す手順はMav