タグ

UIMAとIBMに関するyukio2005のブックマーク (2)

  • エンタープライズサーチエンジンカンファレンス:Media / Art(s) - CNET Japan

    青山で行なわれた、企業向け検索のカンファレンスにいってきました。 まずは、みずほ情報総研株式会社吉川日出行氏による「次世代企業に不可欠なプラットフォーム〜ESPとは」と題したセッション。最初に「普通のホワイトカラーが検索に費す時間は週に9.5時間、うち、3.5時間は干しいものが見付からない」というデータを提示します。これを解消するために「エンタープライズサーチエンジンプラットフォーム(ESP)」という概念を提唱します。これは、「検索」というものを従来の単なる「検索機能」から、企業内のデータを総合的に利用するためのプラットフォームに拡張したもので、これに必要な要素は、「組込可能な検索ツール」「認証システムとの連携」「様々な横断的なインデックス」であるとします。また、「ゲートウェイを通じた様々なファイルフォーマットへの対応」「様々なアクセス制御の仕組み」「スケーラビリティと拡張性の確保」「カス

  • IBM、非構造化データ処理アーキテクチャ「UIMA」をオープンソースコミュニティで公開

    IBMは米国時間1月23日、「Unstructured Information Management Architecture(UIMA)」技術をオープンソースコミュニティに公開したことを発表した。UIMAは、ドキュメントなどの非構造化データを処理するためのアーキテクチャで、キーワードだけでなく、さまざまな関連性や意味を発見するのに役立てられる。IBMは、UIMAのソースコードを、オープンソース関連の最大のウェブサイトであるSourceForge.netで公開した。 UIMAは、非構造化データを検索/分析するのに利用されるソフトウェア同士をネットワーク上で連携させるうえで、役に立つ。非構造化データとは、電子メールやWord文書などのように、行や列の形式で保存されていないデータのこと。

    IBM、非構造化データ処理アーキテクチャ「UIMA」をオープンソースコミュニティで公開
  • 1