2. 今日のテーマ : UIMA UIMA : 非構造化データ管理アーキテクチャ Unstructured Information Management Architecture You – eee – muh と読みます(公式ドキュメント FAQ より) 構造化されていないデータを処理するフレームワーク ⇔ 構造化されたデータ : RDB のデータ、 XML データなど 特に、元々の開発目的である自然言語処理がターゲット OASIS の標準仕様の一つ OASIS は電子ビジネスの基盤となるデータ仕様の標準化団体 SGML 、 DocBook, ebXML などを策定 3. Apache UIMA Apache UIMA : UIMA 仕様のリファレンス実装 元々は IBM Research が自然言語処理用に開発 (2005 年 ) 2006 年、 SourceForge で公開開始 同