タグ

nlpとNLPに関するgoingerのブックマーク (88)

  • Conditional Neural Fields

    年越ししてから既に2ヶ月が過ぎ、2月も終わりが見えかけてきた今日この頃です。 生存報告をかねて、少しだけ最近やっていた事を書いておきます。 去年の年末くらいに、面白そうな論文を見つけたのでそれを読みつつ、実装していました。 NIPS2009 で発表された論文です。 その名も Conditional Neural Fields 。http://books.nips.cc/papers/files/nips22/NIPS2009_0935.pdf 名前から何か感じるところの有る人もいそうですが、これはCRFに隠れ層を加えて、非線形にした物になります。 自分のメモ用に、先に簡単に CRF についておきます。 -- CRF の説明はNLP2006のチュートリアル資料が割と分かりやすいです。 http://nlp.dse.ibaraki.ac.jp/~shinnou/lecture/nl/NLP20

    goinger
    goinger 2010/02/26
  • 言語情報処理 用語集

    [索引] [あ行] [か行] [さ行] [た行] [な行] [は行] [ま行] [や行] [ら行] [わ行] あ行 アーリーアルゴリズム (Earley algorithm) 文脈自由文法に基づく構文解析アルゴリズム.ある非終端記号の直後に現われ得る終端記号を事前に予測することによって解析効率を改善している点が特徴. IIS (Improved Iterative Scaling algorithm) 最大エントロピー法のパラメタを学習するアルゴリズム. 曖昧性 (ambiguity) 自然言語処理では,複数の解析結果が得られることを曖昧性があるという.例えば複数の語義がある場合は語義(選択)に曖昧性があるといい,かかり受け解析において複数の可能性がある場合は,かかり受けに曖昧性があるという.曖昧性は様々な処理レベルで存在し,曖昧性解消(ambiguity resolution, disa

  • Welcome to Language Technology World — LT World

    LT World is the most comprehensive WWW information service and knowledge source on the wide range of technologies dealing with human language. The service is provided for META-NET by DFKI. Content is constantly being improved. Please send corrections and pointers to missing information to Recently the android software allows you to play the new online casinos with mobile applications dedicated to

  • 言語情報処理 ポータル

    言語資源・ツールのカタログを更新いたしました。(2008.10.15) 人材募集を2件更新いたしました。(2008.7.29) 新刊案内を2件追加いたしました。(2008.06.22) 言語資源メタデータDB SHACHI へのリンクを追加しました。(2008.03.27) 人材募集を1件更新いたしました。(2007.11.13) Wikiを開設いたしました。(2007.10.29) 今日11月11日は1が4つ並ぶ珍しい日です。これにちなんだ記念日がたくさんあるのではと思って調べたところ、今日は西陣の日、チーズの日、ピーナッツの日、電池の日、下の日、鮭の日、折り紙の日、ポッキー&プリッツの日、だそうです。最後以外は1が並ぶこととはあんまり関係なさそうですね。(し)

  • Language Media Laboratory Web Page

    京都大学 大学院情報学研究科 知能情報学専攻 知能メディア講座 言語メディア分野 黒橋研究室 研究室では,言語の仕組み,それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と,それによって情報検索,自動翻訳,マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています.(→詳細) メンバー NLPリソース 科研情報爆発 開放型検索エンジン基盤 TSUBAKI (試験運用中) 言語情報処理ポータル 研究室内部ページ 連絡先 〒606-8501 京都市左京区吉田町 Tel/Fax:(075)753-5962 Last Modified: September 7, 2007

  • Apple Pie Parser - 長岡技科大 自然言語処理研究室

  • 自然言語処理のトップカンファレンス - 武蔵野日記

    NAACL HLT 2010 の accepted papers のリストが今日出た。 知っている名前があるかなと思ったが、日人ひとりもいないようだ。 (訂正) 松研先輩の tetsu-na さんが通っているようだ。@cacahoさん情報どうもありがとうございます! MSR 時代のインターン同期とかたくさんいる。やはりカリフォルニア開催だと気合い入れて出してくるからだろうか……。他にも出していると聞いた人が通っていないのを見ると、かなり厳しかった模様。以前 masayu-a さんが日記で(現在はてなダイアリーに引っ越したようだが) NAACL > ACL >> (越えられない壁) >> CoNLL > EMNLP >> (越えられない壁) >> COLING-ACL = ACL-IJCNLP > COLING(ICCL) = >> (越えられない壁) >> EACL > IJCNLP

    自然言語処理のトップカンファレンス - 武蔵野日記
  • べた書きかな文の分かち書き再考 - 武蔵野日記

    最近仕事の行き帰り、片道自転車が40分あるので、研究というかなんというかいろいろ頭の体操をしながら自転車を漕いでいるのだが、今日は @sassano さんに教えてもらって文節をどう区切るかを再読する。いや、N文節最長一致法というヒューリスティックがどういうものだったか(アルゴリズム的にはなにをしていることに相当するのか)考え始めてしまって、なんなんだろうなぁ、と思って……。(もしかしてこのヒューリスティックを統計的な手法で説明できたらおもしろそうだな、と考えたのが事の発端) 基文献としては以下の3点。いずれも(かな漢字交じり文ではなく)かなだけからなる入力をいかに分かち書きするか、という問題に取り組んでいる。前読んだ気がするのだがすっかり忘れていた。かな漢字交じり文であれば漢字からひらがなやカタカナになったり、数字になったりするという、字種の切れ目の情報が使えるのだが、べた書きかな文は字

    べた書きかな文の分かち書き再考 - 武蔵野日記
    goinger
    goinger 2010/02/02
  • 文節をどう区切るか

    日本語入力プログラムの歴史は、入力の効率を求める歴史でした。初めは「これはペンです」という文章を入力するにも、「これは」で一度変換し「ペンです」でまた変換する方式(単文節変換)や、「これは」と「ぺんです」の間に文節を区切る指示を与える方式をとっていました。やがて、単文節変換や文節ごとに区切り記号を入れる方式から、自動的に文節を区切る連文節変換(複文節変換?)へと進化し、さらには文脈に応じて適切な語を選ぶ用例変換、AI変換が花開き、日本語入力は簡単で効率的になっていきました。 このページは、文節を区切る方法について、現行の日本語入力プログラムでよく使われる方式を解説します。用例変換、AI変換は別項にて解説します。 目次 n文節最長一致法 うしろ向きn文節評価最大法 接続コスト最小法 参考文献・資料 n文節最長一致法 採用している日本語入力プログラム:ATOK、EGBRIDGE、VJEなど。

  • PC

    日経コンピュータ 勝村幸博の「今日も誰かが狙われる」 高校入試出願のメール不達は必然 Gmailガイドラインの誤解を解く 2024.03.01

    PC
    goinger
    goinger 2010/01/27
  • Survey1

    Survey1 SVMを用いた固有表現抽出に関する論文のサーベイ 1.Support Vector Machineを用いた日語固有表現抽出 2.Support Vector Machineの多値分類問題への適用法について 3.SVMに基づく固有表現抽出の高速化 4.日語固有表現抽出における文節情報の利用 5.Stackingの効率的な学習方法と日語固有表現抽出での評価 6.非頻出語に対して頑健な日語固有表現の抽出 7.大域的情報を用いた日語固有表現認識 SVMを利用した日語固有表現抽出に関する論文が中心です. 固有表現タグを入力文の解析単位毎に正確に付与することが目的です. チャンカーは基的にYamCha 1.Support Vector Machineを用いた日語固有表現抽出 山田寛康 工藤拓 松裕治 奈良先端科学技術大学院大学情報科学研究科 概要

  • ことば工学研究会

    連絡事項 日知能情報ファジィ学会誌 Vol.23 No.5 (2011年10月号) に掲載された小方論文には、参考文献が掲載されておりません。 [参考文献]を御覧になって下さい。 第74回ことば工学研究会を 日時: 2024年 3月 1日(金)〜 2日(土) 場所: 元 松木工 (今は、木工所ではないのですが、看板はそのままです) (鳥取県倉吉市和田東町121番地1) にて、 テーマ: ぬるいことば、熱いことば をテーマとして開催いたします。 今回も対面と Zoom のハイブリッドで行う予定です。 開催の場所は、倉吉駅からは、タクシーで10分程度になります。 三朝温泉がそばにあります。 恐らく、開催の日は、倉吉は雪が積もっていると思いますが、 研究会としては、「ぬるいことば、熱いことば」をテーマとして行います。 温泉にかけているのですが、ことばには温度があると思います。その温度を いじ

  • NAIST 自然言語処理学講座的大学院時代の過ごし方 - 武蔵野日記

    研究室に行って id:smly くんに(昨日聞かれた)プロジェクト実習の追加の話をしたりなど。そうこうしていると、ご飯一緒に行きませんか、と言われたので shirayuくん、junta-m くんの4人で回転寿司をべに行く。 NAIST で出会いはありますかという話もあったりしながら(自分の答えとしては、外に出た方が見つかりますよ、というものだけど(笑))、大学院生活どう過ごしたらいいのかという話が出たので、ここでも再掲しておく。一応 NAIST の自然言語処理学講座、つまり松研ならこんな感じかな?というガイドラインなので、NAIST でも他の分野のことは知らない(分野によって研究スタイルはかなり異なる)し、自然言語処理でも他の大学はどうか分からない(東大とか京大とかと比べると、文系出身者が1-2割いるということに加え、分野外から来る人が過半数というのは大きな特徴だと思う)ので、この話を

    NAIST 自然言語処理学講座的大学院時代の過ごし方 - 武蔵野日記
  • Journal of Natural Language Processing

    2008 Vol. 15 No. 4 2008.10 Vol. 15 No. 3 2008.7 Vol. 15 No. 2 2008.4 Vol. 15 No. 1 2008.1 2007 Vol. 14 No. 5 2007.10 Vol. 14 No. 4 2007.7 Vol. 14 No. 3 2007.4 Vol. 14 No. 2 2007.4 Vol. 14 No. 1 2007.1 2006 Vol. 13 No. 4 2006.10 Vol. 13 No. 3 2006.7 Vol. 13 No. 2 2006.4 Vol. 13 No. 1 2006.1 2005 Vol. 12 No. 6 2005.11 Vol. 12 No. 5 2005.10 Vol. 12 No. 4 2005.8 Vol. 12 No. 3 2005.7 Vol. 12 No. 2 2005

    goinger
    goinger 2010/01/24
  • 言語処理学会 The Association for Natural Language Processing Home Page

    会員専用ページ (※ 会員情報の登録ならびに会費の納入については株式会社プロアクティブのシステムを使用しています。) 最新のニュースレター Vol.15 No.2 (2008年8月8日発行) 入会案内 雑誌「自然言語処理」の原稿執筆案内 (「3. 原稿の送付」 について変更がありますのでご注意ください) 雑誌「自然言語処理」のバックナンバー 雑誌「自然言語処理」の論文査読倫理綱領 雑誌「自然言語処理」の広告掲載について ニュースレター 年次大会 会則・諸規定(会則,学会員向けメーリングリスト投稿規定など) 日英対訳用語集について 日英対訳用語集(csvファイル) 学会動向調査 以下の内容は、研究者の便宜のためつけておりますが、言語処理学会として 責任を取るものではありません。御了承下さい。 言語データ情報 JEITA言語処理技術専門委員会による言語イニシャティブのリスト その他関連

    goinger
    goinger 2010/01/24
  • 自然言語処理 (用語) - 長岡技術科学大学 電気系 自然言語処理研究室

    しぜんげんごしょり natural language processing 自然言語処理とは、人間の言葉(自然言語)を計算機で処理する技術分野、研究分野である。 テキストマイニングも、自然言語処理と関連の深い隣接分野である。 このページでは、自然言語処理という研究分野、技術分野を広く知っていただくための情報を紹介します。研究室での研究内容については研究内容のページをご覧ください。 研究室では、自然言語処理に関する様々な情報を自主的、継続的に収集、整理し、そのほとんどを公開しています。

    goinger
    goinger 2010/01/24
  • ACL Wiki

    to facilitate the sharing of information on all aspects of Computational Linguistics 31,805,326 visits to 2,547 pages in the ACL Wiki as of Wednesday, August 21, 2024 ACL data and code repository - for NLP and CL data and source code Acronyms - the ABCs of CL and NLP Award recipients - listing of NLP Award recipients Blogs - CL, NLP, linguistics, language Conferences and workshops - where to go an

  • Publications - The Stanford Natural Language Processing Group

  • The Stanford Natural Language Processing Group

    The Stanford NLP Group Welcome to the Natural Language Processing Group at Stanford University! We are a passionate, inclusive group of students and faculty, postdocs and research engineers, who work together on algorithms that allow computers to process, generate, and understand human languages. Our interests are very broad, including basic scientific research on computational linguistics, machin

    The Stanford Natural Language Processing Group
  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品