タグ

2016年6月8日のブックマーク (1件)

  • 日本語 Temporal Awareness コーパス ver 0.1 (2016/06/06)

    コーパスは、日語ツイート内に現れる地名語に対して、ツイートの著者(以下、著者)が「その場に現在いるのか」「いたのか」「行く予定なのか」「言及しているだけなのか」(Liらが文献[3]で Temporal Awarenessと呼んでいる概念と対応)を、ツイートを読んだ第三者がクラウドソーシングを用いて付与したコーパスです。 コーパスを用いて訓練したモデルは、以下のような応用が考えられます: 観光地等のスポットの混雑予測 スポットの現在実況のみの収集/要約 スポットを実際に訪れた人の感想や意見のみをフィルタリング アノテーションガイドライン 以下の10種類のターゲット(地名語)を含むツイート各1200ツイートを元データとし、 Yahoo! クラウドソーシング を用いて以下のようなガイドラインのもとでアノテーションを収集しました。 固有名詞 秋葉原 仙台 渋谷駅 清水寺 スカイツリー 一般名