タグ

Researchとnlpに関するKshi_Kshiのブックマーク (31)

  • ACL HLT 2011 2日目: NLPのトレンドはグラフを用いた手法 - 武蔵野日記

    5時に日光で自然に目が覚めたので電話。前使っていたプリペイドの携帯を持ってきたので$30チャージして、かれこれ3時間くらい話していると思うのだが、まだなくならない。日の携帯電話にかけて1分$0.15のレートなので、200分いけるようだ。 朝はベストペーパー・ペストスチューデントペーパー・ベストショートペーパーの3のトーク。これらの論文が決まらないと会議のプログラムを確定できないので、早くプログラムを公開してほしい、といろんな人からせっつかれて困った、と (ACL のプログラム委員長) 松先生がぼやいていたのだが、ベストペーパーの紹介を今日は松先生がして、ベストペーパーを事前に発表する Pros and Cons というタイトルでしっかり「事前に決めるのは大変だった」と苦言を呈していた (笑) 副学長に加えてプログラミング委員長、なんだか今年松先生は忙しそうな年である。 さてベスト

    ACL HLT 2011 2日目: NLPのトレンドはグラフを用いた手法 - 武蔵野日記
  • evaluative expressions

    評価値表現辞書 (評価表現辞書) はじめに 近年,blogなどを通して個人がネット上に配信する情報の重要性が広く認知 されるようになり,それにともなって,個人の意見をWeb上のテキストから収集,分析する技術への関心が高まっています. 実際に,ここ数年で意見を扱った多くの研究が発表されています (関連研究についてはこちらをご参照ください). 意見の収集,分析には評価をあらわす表現(以下,評価値表現)が手がかりになると考えられます. 我々は,評価値表現はある程度ドメイン横断的に使用可能だと考え,半自動手法を使用しつつ辞書を作成しました. この辞書が意見情報抽出や分析の研究に携わっていらっしゃる方々の手助けになれば幸いです. 評価値表現辞書とは 評価値表現辞書は,評価を表すために使われる可能性のある表現を集めた辞書です. 我々は評価を以下のように定義しています. 評価の主体が評価対象のクラスに対

    Kshi_Kshi
    Kshi_Kshi 2012/11/21
    卒研に使った辞書懐かしい。
  • Part of speech tagging

    EMNLP 2012 参加報告 東北大学大学院情報科学研究科 東北大学工学部情報知能システム総合学科 東北大学電気通信情報機構 JST 戦略的創造研究推進事業「さきがけ」・ 「情報環境と人」 岡崎 直観(okazaki at ecei tohoku ac jp) http://www.chokkan.org/ @chokkanorg 2012-09-04 EMNLP 2012 国際会議参加報告 1 http://www.chokkan.org/publications/emnlp2012.pdf EMNLP 2012 • スケジュール • 2012年3月28日: 論文投稿締切り(ACL 2012の採択通知後) • 2012年5月1日~4日: 著者回答期間 • 2012年5月18日: 採択通知 • 2012年6月3日: 最終原稿締切り • 2012年7月12日~14日: 会議開催(韓国の済州

    Kshi_Kshi
    Kshi_Kshi 2012/11/21
    okazaki 先生のスライド
  • Catalogue of Language Resources and Tools in Japan

    [形態素解析器] [パーザ] [ツール(その他)] 新聞記事 毎日新聞CD-ROM 毎日新聞CD-ROM (1991年) 毎日新聞CD-ROM (1992年) 毎日新聞CD-ROM (1993年) 毎日新聞CD-ROM (1994年) 毎日新聞CD-ROM (1995年) 日経新聞CD-ROM 日経産業・金融・流通新聞CD-ROM 読売新聞CD-ROM (邦文記事) 読売新聞CD-ROM (英文記事) 朝日新聞CD-ROM 注釈付きコーパス RWCテキストデータベース RWC-DB-TEXT-94-1 RWC-DB-TEXT-94-2 RWC-DB-TEXT-95-3 RWC-DB-TEXT-96-2 RWC-DB-TEXT-97-1 CRL-DB-TEXT-97-1 EDR日語コーパス EDR英語コーパス 京都テキストコーパス JEITAマルチモーダル対話コーパス

    Kshi_Kshi
    Kshi_Kshi 2012/11/21
    とても助かるまとめ
  • isoHunt › the BitTorrent & P2P search engine

    Kshi_Kshi
    Kshi_Kshi 2012/11/21
    これは公開されいたらマズイのでは。「日本語大シソーラス 類語検索大辞典」
  • Alan Ritter

    Kshi_Kshi
    Kshi_Kshi 2012/09/28
    情報抽出の分野で目立っている研究者
  • Dan Roth - Main Page

    I moved to the University of Pennsylvania. See my page there My research focuses on the computational foundations of intelligent behavior. We develop theories and systems pertaining to intelligent behavior using a unified methodology -- at the heart of which is the idea that learning has a central role in intelligence. My work centers around the study of machine learning and inference methods to f

    Kshi_Kshi
    Kshi_Kshi 2012/09/28
    semanticsな情報抽出とか盛んなイメージ。優秀な業績出しているイメージ。
  • Twitter Calendar

    Kshi_Kshi
    Kshi_Kshi 2012/09/25
    KDD 2012 の論文: Open Domain Event Extraction from Twitter
  • http://www.cl.ecei.tohoku.ac.jp/~inui/papers/0610Fuzzy.pdf

    Kshi_Kshi
    Kshi_Kshi 2012/07/03
    自然言語処理の再挑戦~統計的言語処理を超えて~
  • http://arakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/NLP2010_poster.pdf

    Kshi_Kshi
    Kshi_Kshi 2012/05/11
    CAO 全自動顔文字解析システムに向けて
  • Eiji ARAMAKI, Ph.D.

    e-mail: aramaki@hcc.h.u-tokyo.ac.jp 〒113-8655, 東京都文京区郷7-3-1, 東京大学工学部旧2号館2階205号(セミナー室2) 東京大学 知の構造化センター 荒牧英治 03-5841-0891 (内線: 20891) 研究分野:自然言語処理(機械翻訳), 医療情報学(医療テキスト解析) 所属学会: 言語処理学会,認知科学会,情報処理学会,医療情報学会,日物理学会,ACL 学位論文: "Formalization and Realization of Example-based Machine Translation", 東京大学 情報理工学系研究科, 2005. 論文| レターズ| 国際会議| 国内発表| 総説| 受賞| 社会活動| メディア| 共同研究| 特許| 外部獲得資金| 招待講演| 展示| 略歴| 趣味 論文/ジャーナル

    Kshi_Kshi
    Kshi_Kshi 2012/03/23
    twitter関連の研究多し。参考になります。
  • Loading...

  • 第1回にこにこテキストマイニング勉強会に参加しました #nicotextmining - nokunoの日記

    というわけで参加してきました。第1回 にこにこテキストマイニング勉強会 : ATND 目的テキストマイニングについての学習のスタートアップテキストマイニング技術に関して気軽に参加・議論することができる場の提供 概要テキストマイニングとは、例えば製品の評判をweb上のテキストから抽出したり、大量のアンケートテキストを分析するために用いられる技術であり、特にマーケティングの場で多くの利用例があります。この勉強会ではそうしたテキストマイニングを題材とし、用いられている要素技術とそれに関わる課題の議論、またテキストマイニングを実務に活かす方法について考えていきます。 会場のオラクルセミナールームでは隣でPythonハッカソンが行われており、そちらにも知り合いがいたり飲み物が無料だったりして居心地の良い場所が形成されていました(入るまでが大変でしたが‥)。Python Hack-a-thon 201

  • 評判辞書の中身を覗いてみた - nokunoの日記

    先日のにこにこテキストマイニング勉強会で、東工大の高村大也先生の「単語感情極性対応表」が話題になりました。PN Tableそこでこの辞書(仮に評判辞書と呼びます)を覗いてみます。wget http://www.lr.pi.titech.ac.jp/~takamura/pubs/pn_en.dicwget http://www.lr.pi.titech.ac.jp/~takamura/pubs/pn_ja.dicwc pn_ja.dic 55125 59133 1723987 pn_ja.dicwc pn_en.dic 88015 88015 1931411 pn_en.dicnkf -w pn_ja.dic > utf8.dicまず、辞書の上位を見てみると「優れる」を筆頭にポジティブな単語が並んでいます。less pn_ja.dic優れる:すぐれる:動詞:1良い:よい:形容詞:0.9999

    Kshi_Kshi
    Kshi_Kshi 2012/02/03
    評判辞書
  • 最近読んだ論文(半教師CRF、教師有りLDA、TextRank) - 木曜不足

    読んだ自然言語処理や機械学習の論文を twitter でちょこっと紹介してみたりしている。 さらっと手短に書けていい感じ(と勝手に思っている)なのだが、論文名を書く余白がないのと、短いとは言え2個3個の tweet には分離してしまうあたりが減点。 というわけで、はてなダイアリーの twitter 記法で試しにまとめてみたのだが、うーん、決して見やすくはないなあ……。 再編集してまで紹介したい論文なら、別途記事を書けばいいし。悩ましい。 半教師CRF "Semi-Supervised Conditional Random Fields for Improved Sequence Segmentation and Labeling" (Jiao+, COLING/ACL 2006) http://www.metabolomics.ca/News/publications/Jiao_et_al

    最近読んだ論文(半教師CRF、教師有りLDA、TextRank) - 木曜不足
    Kshi_Kshi
    Kshi_Kshi 2012/02/01
    論文を紹介
  • Enron Email Dataset

    This dataset was collected and prepared by the CALO Project (A Cognitive Assistant that Learns and Organizes). It contains data from about 150 users, mostly senior management of Enron, organized into folders. The corpus contains a total of about 0.5M messages. This data was originally made public, and posted to the web, by the Federal Energy Regulatory Commission during its investigation. The emai

    Kshi_Kshi
    Kshi_Kshi 2012/01/30
    #social_data
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    Kshi_Kshi
    Kshi_Kshi 2012/01/29
    鹿島久嗣先生
  • Co-clustering の自然言語処理への応用 - 武蔵野日記

    合同研2日目終了。岡山大高橋秀幸さんの「共通概念を持つ動詞集合獲得を指向した同時クラスタリングの精度の改善」という話がおもしろかったかな? 動詞のクラスタリングに名詞(実際は名詞と格助詞のペア)を用い、逆に名詞のクラスタリングに動詞を用いる、という方法で、動詞のクラスタリングの精度を上げよう、という内容。ちょっと計算量が大変そうだったが、いろいろ制約を入れて計算可能なところにしているような感じ(精度の問題もあるだろうけど)。先日自分も関連研究として教えてもらったのだが、 Akiko Aizawa. A method of cluster-based indexing of textual data. COLING-2002. の他に、 Inderjit S. Dhillon, Subramanyam Mallela, Dharmendra S. Modha. Information-The

    Co-clustering の自然言語処理への応用 - 武蔵野日記
    Kshi_Kshi
    Kshi_Kshi 2012/01/22
    Co-Clusteringの話
  • 形態素解析器を作るのは包丁を作ったり研いだりする仕事 - 武蔵野日記

    メールの返事をひたすら書く。 昼、電話会議。なんだか先が見えてきて楽しくなってきた。やはり生データを見ると盛り上がってくるのは自分がそういう性分なんだろうか。 夕方、takeshi-na さんの意見情報マイニングのチュートリアルに出る。マーケティングの現場ではどこまでテキストマイニングが使われているかの体験談などお話くださって、参考になる。自分の感覚では、ウェブマイニングにいまの自然言語処理の技術を適用するのは、形態素解析くらいが限界で (それでも厳しい)、それ以上は難しいと思うのだが……。企業内で分野が限定されたテキストデータのマイニングなんかだと、たとえば製品名一覧が載っている電子マニュアルがあったり、専門用語辞書を内部的に持っていたりして、そういうのを使えるからいいのだけど、ウェブだとそんなのがないのでけっこうしんどい。ウェブデータからテキストマイニングしている人って、当に顧客が満

    形態素解析器を作るのは包丁を作ったり研いだりする仕事 - 武蔵野日記
    Kshi_Kshi
    Kshi_Kshi 2012/01/22
    NLPのレイヤーの話。基盤ツール開発側か、応用する側なのかという話がわかりやすい。
  • 自然言語処理紹介(就職編)

    第1回Webインテリジェンスとインタラクションセミナー(いまさら訊けないシリーズ「言語処理技術」)での発表資料です。 https://www.sigwi2.org/next-sig 東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Networ

    自然言語処理紹介(就職編)