タグ

2012年6月21日のブックマーク (2件)

  • 【Credibility for the 21st Century】2. ウェブ情報の特徴 | Yusuke Yamamoto's Web site

    ウェブ情報の特徴1: ゲートキーパーの不足 新聞や書籍,雑誌,テレビなどは,一定レベルの事実確認,内容のチェック,編集チェックを受けている. 同様のチェックが,ウェブ情報に対して必ずしも行われているわけではない. 「オンライン新聞サイトや有名なポータルサイトは内容のチェックを受けている」という声もあるだろうが,そういうサイトは広大なウェブ世界ではむしろ少数派. ウェブ情報の大半は非公式な情報であり,どの程度内容の精査がされているのかは不明. 内容チェックを受けなくても情報発信できるということが,正確な情報をウェブで発信しなければという社会的なプレッシャーを低減させる(Jonson and Kaye 1998). ウェブ情報の特徴2: 異種情報の混在 特徴的な例は「広告と非広告情報の混在」(Alexander & Tate 1999, Flanagin & Metzger 2000). 紙出

  • 多目的かつ高速軽量な自然言語処理ツールSENNA - 自然言語処理 on Mac

    昨年米国で開催されたTAC 2011 RTE-7では、NECのシステムが第一位を獲得したそうです: NECのテキスト含意認識技術がNIST主催の評価タスクで第一位を獲得(2012年4月13日): プレスリリース | NEC IKOMA at TAC2011: A Method for Recognizing Textual Entailment using Lexical-level and Sentence Structure-level features このシステムのテキスト解析にはSENNA (Semantic/syntactic Extraction using a Neural Network Architecture) というツールが利用されています。SENNAは、多層ニューラルネットに基づいて、品詞タグ付け、チャンキング、固有名抽出、意味役割ラベリング、構文解析といった様々

    多目的かつ高速軽量な自然言語処理ツールSENNA - 自然言語処理 on Mac
    tnal
    tnal 2012/06/21