[B! Tica] rabbit2goのブックマーク

rabbit2go id:rabbit2go

Ticaに関するrabbit2goのブックマーク (1)

Apache Tikaでコンテンツを読み込んでみる - Qiita
Apache Tikaとは Apache Tika Apache TikaはJavaで開発されたドキュメント分析およびメタデータ抽出ツールキット。さまざまなドキュメント形式に対応しており、対象データからメタデータの抽出を実施する。Tikaは以前はApache Luceneのサブプロジェクトだったが、現在ではApacheソフトウェアファウンデーション直下のプロジェクトとして扱われている。 PDFやOffice文書からメタデータを抽出する「Apache Tika 1.0」登場とりあえず使ってみる今回は試しに動かしてみたいだけなので Apache Tika - Download より、tika-app-1.4.jarをダウンロード。動作にはJava 5以上あればよいらしい。 Getting Started with Apache Tikaを参考に動かしてみるよ。例えばQiitaのトップか
rabbit2go 2017/08/26
Apache

Tica

テキスト抽出
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx