タグ

2014とdataminingに関するtnalのブックマーク (2)

  • 学生データサイエンティスト日本一決定戦 Data League <予選> | クラソル | CrowdSolving

    <問題> 2009~2013年,及び2014年5月までのプロ野球選手の各月の打撃成績データを用いて 2014年6月,7月に各選手の年間通算打率がどのように推移していくかを予測してもらいます. <データ> 学習用のデータとして,2009~2013年,及び2014年の5月までの プロ野球の選手別月別の打撃成績実データを提供します. このコンペは,『キャリフル』が主催しています. データは国内外の様々なスポーツデータを取り扱う『データスタジアム株式会社』より提供. 問題は米国のデータ分析プラットフォーム『kaggle』で世界2位を叩き出した水田有一氏が監修しています. なお,選では2014年のMVPを成績データから予測してもらう予定です. MVPは記者投票によって決定され,毎年11月末に発表されます. 【キャリフルとは】 キャリフルは,学生が「スキル」や「ポテンシャル」といった持ち味をみつけ,

  • EntityLinkingメモ - Negative/Positive Thinking

    はじめに WSDM2014(WWW2013,YSS2013,SIGIR2013)のチュートリアルで「EntityLinking」といタスクが紹介されていたので、ちょっと調べてメモしておく。 次元圧縮! Entity Linkingとは テキストに出てくるエンティティ(実体)を識別・決定するタスク 固有名詞抽出は「固有名詞を識別して取り出す」タスクなので、異なる 雑にいうと、KnowledgeBaseと呼ばれる(識別された)エンティティ集合からテキストにでてくるエンティティを決定すること KBにない新しい固有名詞を発見することも含まれたりする(「NIL」として取り扱う) 実際の例 テキスト「東京タワーに行った」 固有名詞抽出 「東京タワー」を取り出す Entity Linking 「東京タワー」が以下のreference(ここではWikipediaのページ)と対応することを決定する http

    EntityLinkingメモ - Negative/Positive Thinking
  • 1