タグ

ブックマーク / www.cl.ecei.tohoku.ac.jp (3)

  • Message to Students - 東北大学 乾・鈴木研究室 / Communication Science Lab, Tohoku University

    Message to Students【配属を検討しているみなさんへ】 『Tohoku NLP Group の研究室(坂口・乾研, 鈴木研, 松林研) への配属を検討しているみなさんへ』 東北大学の学部3年生、および修士課程・博士課程からの進学を検討している全国のみなさんに向けた文章です。 私たちの研究室では、計算機と数理の力を用いて言語の情報処理に取り組む元気な仲間を募集しています! これを読んで私たちの研究室に少しでも興味を持ってもらえたなら、ぜひ直接研究室を訪ねてきてください。見学は常時受け入れています。実際に研究室を目で見て、メンバーと話をして、みなさんが充実した時間を過ごせそうか(空気や方針が合っているか)をじっくり確認してください。一同、みなさんとお会いできることを心から楽しみにしています。 学部3年生向け研究室紹介 のページにも関連情報をまとめてあります。 初稿:2018年1

  • 場所参照表現タグ付きコーパス Ver 0.1 (2015/05/25)

    概要 コーパスは,Twitterからランダムにサンプリングしたテキストに現れる,「特定の場所を著者が想定している」と判断できる表現に対して,実際にどのエンティティを指しているかを人手で判断しエンティティ情報を付与したコーパスです.GeoNLPなどのジオパーズシステム,エンティティリンキングシステム等の開発や評価に利用することを想定して構築されました. コーパスには以下のような特徴があります. 施設名へのアノテーション付与 : いわゆる「地名」(市区町村名など)だけではなく,「施設名」(駅名等)に対してもエンティティを付与しています. 一般名詞からなる表現にも付与 : 「特定の場所を著者が想定している」表現というと,すぐに思い浮かぶのは都道府県名・駅名などの固有名詞ですが,上図における「バス停」のように,一般名詞であっても,特定の場所を指し示す表現が存在するため,それらへもアノテーション

    laughing
    laughing 2015/05/26
  • 言語処理100本ノック 2015

    言語処理100ノックは,実践的な課題に取り組みながら,プログラミング,データ分析,研究のスキルを楽しく習得することを目指した問題集です 実用的でワクワクするような題材を厳選しました 言語処理に加えて,統計や機械学習などの周辺分野にも親しめます 研究やデータ分析の進め方,作法,スキルを修得できます 問題を解くのに必要なデータ・コーパスを配布しています 言語はPythonを想定していますが,他の言語にも対応しています

    laughing
    laughing 2015/03/12
  • 1