XQEngine is a full-text search engine for XML documents. Utilizing XQuery as its front-end query language, it lets you interrogate collections of XML documents for boolean combinations of keywords, much as Google and other search engines let you do for HTML. XQuery, however, provides much more powerful search capabilities than equivalent HTML-based engines, since its XPath component lets you speci
XSS対策として入力値チェックライブラリを考えているんですが、入力値としてHTMLを許可する場合、これを解析してなんとかならんもんかと思ってたりします。 JavaのHTMLパーサ XMLスキーマとかも使えそうなもんですが、柔軟になる分、ユーザはXMLスキーマの書き方を覚えなければならないわけで、いろんなチェックを、フィルタを通すように使える設計で作っておいて、「IE8がでたー!」となったときでも「IE8Filter」を追加で作って、フィルタに追加するだけー・・・とかにしようかと。 調べてみると、いがぴょんさんのJavaで実装された HTML Parser (HTMLパーサ) を調べてみましたがとても素敵です。これにパフォーマンスとか、使い勝手を加えてまとめてみます。 今回、Google先生や、いがぴょんさんも言及しているOpen Source HTML Parsers in Javaから、
FreeHtmlAnalyzerは、URLを入力してボタンを押すと、Webページのプレビュー表示や、ページに含まれているリンク・イメージファイルを一覧表示する。 Webサイトをブラウズするとき、そのページの情報を調べたいと思うことはないでしょうか。たとえば、そこで使われているイメージファイルをチェックしたい、とか、リンク先をチェックしたい、というようなことですね。このJavaプログラミングをご覧になっている人の中にはWeb開発に携わる人も少なくないでしょう。そうした方なら、参考になるサイトのソースコードを調べたりした経験があるはずです。 そこで、Webのページを調べて、そこにある要素を解析するようなツールを作成してみましょう。とりあえず今回作成してみるのは、HTMLのソースコードから<img>タグのsrcと<a>タグのhrefをすべて抜き出し表示するというものです。つまり、そのページに含ま
XMLBeans is a technology for accessing XML by binding it to Java types. XMLBeans provides several ways to get at the XML, including: Through XML schema that has been compiled to generate Java types that represent schema types. In this way, you can access instances of the schema through JavaBeans-style accessors after the fashion of "getFoo" and "setFoo". The XMLBeans API also allows you to reflect
情報インフラの発展に伴い,私たちが接する情報の絶対量は増加の一途をたどっています。そのため,目的とする情報をすばやくピンポイントで入手するのが困難な状況も増えています。 一方で情報提供側にとっても,情報を確実に利用者に届けることがビジネスの成功に重要な要素となってきており,これを実現するための努力が日々続けられています。 このような状況で,高速で柔軟性が高い検索処理のニーズが高まってきており,全文検索エンジンが注目を集めています。ここでは,オープンソースの全文検索エンジンである「Lucene/Solr」を紹介します。 Lucene/Solrとは Lucene/Solrは,Apache Software Foundation(ASF)のLuceneプロジェクトで開発されているソフトです。LuceneはPure Javaで実装された全文検索エンジンで,単独では実行不可能なライブラリの形式で提供
Apache Tika - a content analysis toolkit The Apache Tika™ toolkit detects and extracts metadata and text from over a thousand different file types (such as PPT, XLS, and PDF). All of these file types can be parsed through a single interface, making Tika useful for search engine indexing, content analysis, translation, and much more. You can find the latest release on the download page. Please see
Recent News JRuby 9.4.8.0 Released The JRuby community is pleased to announce the release of JRuby 9.4.8.0. Homepage: https://www.jruby.org/ Download: https://www.jruby.org/download JRuby 9.4.x targets Ruby 3.1 compatibility. Thank you to our contributors this release, you help keep JRuby moving forward! @edipofederle, more... Awards InfoWorld 2010 Bossie Awards: Best of Open Source Software InfoW
NetBeansプラットフォームは、大規模なデスクトップ・アプリケーションの基礎にすることができる、広範なJavaフレームワークです。NetBeans IDE自体は、NetBeansプラットフォームに基づいた数百のアプリケーションの1つです。NetBeansプラットフォームは、ウィンドウ、アクション、ファイル、およびアプリケーションに一般的なその他の多くの処理を容易にするAPIを含んでいます。 NetBeansプラットフォーム・アプリケーションのそれぞれの機能は、プラグインに似た個別のNetBeansモジュールによって提供されます。NetBeansモジュールは、特定の機能を持つアプリケーションを提供する、Javaクラスのグループです。
News 27 June 2013: FreeMarker 2.3.20 was released This version comes with better error messages, better boolean formatting, higher multi-core performance, and many other smaller improvements and fixes. See all the changes here... Download it here... (GAE-compatible binary here...) What is FreeMarker? FreeMarker is a "template engine"; a generic tool to generate text output (anything from HTML to a
Do you like Git as much as Subversion? Check our new project: SubGit - safe migration from Svn to Git (and back). What is SVNKit Subversion is a leading and fast growing Open Source version control system. SVNKit brings Subversion closer to the Java world! SVNKit is a pure Java toolkit - it implements all Subversion features and provides APIs to work with Subversion working copies, access and mani
Sen は Java で書かれた日本語形態素解析システム。 C++ で開発されている MeCab を Java に移植したもの。 辞書は MeCab、茶筌と同じIPAの辞書を利用。 Sen配布ページ 辞書の構築に Apache Ant が必要。 このページは Sen version 1.2.2.1 用である。 インストール Apache Antのインストール Sen は辞書を構築するのに Apache Ant というビルドツールを使う。 これをあらかじめインストールしておく必要がある。 Apache Ant のインストール Senのインストール パッケージはSen配布ページから sen-1.2.2.1.zip をダウンロードしておく(mirror)。以下では ~学籍番号/Desktop/ にダウンロードしたものとして話を進める。 展開 /usr/local に展開し、ディレクトリ名を se
Jetspeedによるポータルサイトの構築 (旧 1.4b3版についての記述はこちら) Jetspeed Resources (未) このドキュメントに関するご意見、ご要望などはまで。
About Apache Portals Overview Our Mission News and Status How the ASF Works Project Guidelines Who We Are Supporting Organizations License Resources Downloads JavaDocs Mailing Lists Issue Tracking Wikis Portals Sub projects Pluto Portals Dormant Overview Jetspeed-2 Applications Bridges Jetspeed-1 Development Developer Resources Coding Standards Documentation Standards Developer Resources Further R
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く