2015年12月23日23:17 AWS JavaScript AWS Lambdaを使ってサーバレスでテキスト抽出するぞ!という気持ち この記事は 今年もやるよ!AWS Lambda縛り Advent Calendar 2015 の23日目です。 「何か書くぞ!」と思いエントリーしてみたもののどうしよう、、と思っていたのですが、そういえば個人的に Apache Tika というのが最近気になっていたので使ってみることに。 Apache Tika これは、PDFやエクセル等のファイルから、テキストデータやメタデータを抽出してくれるという便利ライブラリです。これを使って、ファイルが登録されたら裏でテキストデータを抽出して、それを全文検索で引っかかるようにする…みたいなことが出来ると楽しそうです。 Apache Tika自体はJavaのライブラリなのですが、Node.jsから扱うためのライブラ
![AWS Lambdaを使ってサーバレスでテキスト抽出するぞ!という気持ち - (゚∀゚)o彡 sasata299's blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/141a9279de70399819aee16b589425c62f801001/height=288;version=1;width=512/http%3A%2F%2Flivedoor.2.blogimg.jp%2Fsasata299%2Fimgs%2Ff%2F4%2Ff42b20fc.jpg)