タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

日本語と富士通に関するrichard_rawのブックマーク (1)

  • 大量の文書データから固有名詞を高精度に抽出する技術を開発 : 富士通

    大量の文書データから固有名詞を高精度に抽出する技術を開発 固有名詞辞書を自動生成する技術を新規に開発し、抽出ミスの数を60%削減 株式会社富士通研究所(注1)(以下、富士通研究所)はこのほど、文章中から人名や組織名、地名などの固有名詞を精度良く抽出する技術を開発しました。今回開発した技術により、新聞記事から約97%の精度で人名を正しく抽出し、従来の抽出手法と比較して抽出ミスの数を60%近く減少させることに成功しました。 単語抽出に必要となる固有名詞辞書を、文書データから自動的に生成する技術を開発したことにより、文書検索や、固有名詞チェック、個人情報の匿名化などの作業を効率よく実施することが可能になります。 技術を適用した新聞記事作成業務支援ソリューションを、2009年11月24日(火曜日)から28日(金曜日)まで、東京国際展示場(東京ビッグサイト)で開催される第20回新聞製作技術展(JA

  • 1