タグ

自然言語処理に関するanakingのブックマーク (21)

  • 米エンロン社の電子メール150万通:その利用法(下) | WIRED VISION

    米エンロン社の電子メール150万通:その利用法(下) 2006年2月 2日 コメント: トラックバック (0) Ryan Singel 2006年02月02日 (2/1から続く) エンロン社の電子メールをデータベースとして利用しているのは営利組織だけではない。 学術機関に所属する研究者たちは、エンロン社のメールがまたとない公開データの宝庫であることをすぐに理解した。社会的ネットワーク、情報分析、情報検索などに興味を持つ研究者にとって、利用価値の高いデータなのだ。 このデータベースは間もなく、『エンロン・コーパス(PDFファイル)』として知られるようになった。 カリフォルニア大学バークレー校情報管理・システム学部のマーティ・ハースト準教授は2004年、自分が受け持つ自然言語処理コースの学生に、データベースをクリーンアップして検索できるようにするという課題を与えた。 「この課題を通して、学生は