タグ

analysisとtextに関するnilabのブックマーク (5)

  • http://labs.keywalker.jp/

    nilab
    nilab 2006/12/07
    キーウォーカー・ラボ - KEYWALKER Labs:次世代解析・検索機能の実験室です。 当社では開発を進めてきた日本語自然文意味検索・解析技術
  • NExT - NE Tagger

    概要 Abstract 【主な特徴】 Named Entity Extraction Tool(以下NExT)は、固有表現抽出ツールです。 大量のテキスト文書情報に含まれる人名、組織名、地名、数量表現を自動的に判別し、 様々な形式で抽出・タグ付けします。NExTは、 形態素解析処理済のテキスト情報を入力とすることで、より精度の高い処理が可能です。 現在は、茶筅(ChaSen Ver.2.02[Matsumoto1998], chasen-2.3.0[Matsumoto2003])および Juman version 3.0[Kurohashi1996]の形態素解析システムの処理結果が利用可能です。 NExTは、 Perl で記述しています。NExTは、NExT開発 Project によって開発されています。 NExTは、Perlが動作する環境であれば、UNIX, Win32, OS/2 を

    nilab
    nilab 2006/11/28
    NExT - NE Tagger : Named Entity Extraction Tool(以下NExT)は、固有表現抽出ツールです。大量のテキスト文書情報に含まれる人名、組織名、地名、数量表現を自動的に判別し、様々な形式で抽出・タグ付けします。NExTは、 形態素解析処
  • NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro

    NTTデータは10月11日,同社が開発した全文検索エンジン「Ludia」をオープンソース・ソフトウエアとして無償公開した。オープンソースのDBMS PostgreSQLに格納されたテキスト・データの全文検索を行う。同社では「商用のデータベース管理ソフトに匹敵する速度と精度を備える」としている。 NTTデータでは「データベース内のデータの全文検索ではこれまで,オープンソース・ソフトウエアでは日語に対応した高速・高精度なものが存在せず,データベースからデータを取り出し別のシステムを構築する必要があった。Ludiaは商用のデータベース管理ソフトに匹敵する速度と精度を備える」としている。 Ludiaは,N-gramと形態素解析の2種類の全文検索インデックス方式をサポートする。ブーリアン検索,近傍位置検索,類似文書検索といった検索が可能で,検索結果の合致度を示す「スコア」も提供する。 Ludiaは

    NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro
    nilab
    nilab 2006/10/15
    NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro : senna + PostgreSQL による全文検索システム : どこかにも同じようなのがあったような
  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    Code Archive Skip to content Google About Google Privacy Terms

    nilab
    nilab 2006/06/27
    CaboCha: Yet Another Japanese Dependency StructureAnalyzer : 南瓜:CaboCha は, Support Vector Machines に基づく日本語係り受け解析器
  • NTTデータ公式サイト

    NTTデータ(国内事業会社) 企業情報 プロフィール 社長メッセージ 役員一覧 NTTデータのテクノロジー NTTデータグループ(持株会社) 企業情報 プロフィール 社長メッセージ Our Way 役員一覧 サステナビリティ 沿革 グループ会社 協賛・文化活動 取引先企業の皆様へ NTT DATA, Inc.(海外事業会社) 企業情報

    NTTデータ公式サイト
    nilab
    nilab 2005/10/12
    自然言語処理技術を活用し、複雑な特許文書を読みやすくする技術。特許文構造解析技術
  • 1