タグ

ブックマーク / skozawa.hatenablog.com (3)

  • 言語処理学会に参加した - skozawa's blog

    今年は京都(京大)であったということもあって、言語処理学会第21回年次大会に参加してきた。 16~21日でチュートリアル、会議、ワークショップとあったけど、会議の1,2日目とワークショップの計4日間参加。 会議で発表を聞いたものの中から覚えている/気になったものをメモ程度に。 素性に重みを付けるSelf-training手法を用いた文書分類の領域適応 ドメイン適応にself-trainingを適用し、素性の重み付けも少し従来と変えるアプローチ 重み付けのところの有効性はあまりよくわからなかった self-training、勝手に98, 99%とかすごい高い精度じゃないとうまくいかないと思ってたのだけど、性能向上していたので意外だった 議論文生成における文抽象化のための固有表現抽象化 聞きたかったけど、人気だったのであんまりちゃんと聞けなかった 固有表現と固有表現の抽象化候補が与えられ

    言語処理学会に参加した - skozawa's blog
    morioka
    morioka 2015/03/22
  • 文節境界解析のラベルと性能 - skozawa's blog

    文節境界解析で使うラベルで、BIとBILUの2種類でどちらが性能がよいかを検証してみた。結果的にはBIだけのほうが性能が高かった。 前回の輪読会で紹介した固有表現抽出に関する論文の中で印象に残ったことのひとつとして、系列ラベリングに使うラベルで最近はBIOよりもBILOUを使ったほう性能が高いというものがあった。 BIO(Begin, Inside, Outside)とBILOU(Begin, Inside, Last, Outside, Unit(Begin and Last))の違いは固有表現の末尾を考慮するかどうかで、末尾を考慮したほうが性能がよいというもの。 社内輪読会で「Joint Inference of Named Entity Recognition and Normalization for Tweets」を紹介した - skozawa's blog Comainuでは、

    文節境界解析のラベルと性能 - skozawa's blog
    morioka
    morioka 2014/07/01
  • 社内輪読会で「Topical Keyphrase Extraction from Twitter」を紹介した - skozawa's blog

    会社で最近始まった論文の輪講で担当だったので、発表をした。 論文はできるだけ自分の分野のトップカンファレンスから選ぶということだったので、自然言語処理の国際会議のACLから論文を選んで紹介した。 今回紹介したのは、少し古いけど、ACL2011からTopical Keyphrase Extraction from Twitter 参加してる人はそれぞれ分野が違うので、どの部分をどの程度説明すればいいかが難しい。 内容 内容はTwitterからトピックのキーフレーズを抽出する手法の提案で、提案は主に以下の2点 Context-sensitive Topical PageRank によるキーワードスコアリング relevanceとinterestingnessを用いたキーフレーズスコアリング 紹介したものを少し修正したものをアップした。 感想 1つ目はスコアリングの際にトピックを考慮することによ

    社内輪読会で「Topical Keyphrase Extraction from Twitter」を紹介した - skozawa's blog
    morioka
    morioka 2014/05/08
  • 1