[B! 学習][自然言語処理] bunhikoのブックマーク

bunhiko id:bunhiko

学習と自然言語処理に関するbunhikoのブックマーク (2)

大規模データを基にした自然言語処理 - DO++
人工知能基本問題研究会 (SIG-FPAI)でタイトルの題目で一時間ほど話してきました。発表資料 [pptx] [pdf] 話した内容は - 自然言語処理における特徴ベクトルの作り方と、性質 - オンライン学習, Perceptron, Passive Agressive (PA), Confidence Weighted Learning (CW) 確率的勾配降下法 (SGD) - L1正則化, FOLOS - 索引を用いた効率化, 全ての部分文字列を利用した文書分類で、スライドで70枚ぐらい。今までの発表とかぶっていないのはPA CW SGD FOLOSあたりでしょうかオンライン学習、L1正則化の話がメインになっていて、その両方の最終形の確率的勾配降下法 + FOLOSの組み合わせは任意の損失関数に対してL1/L2正則化をかけながらオンライン学習をとても簡単にできるという一昔前
bunhiko 2009/03/14
自然言語処理

資料

学習

アルゴリズム
リンク
形態素解析・構文解析入門
back 注意: このページの内容には、おそらく多くの間違いがあります。リンクされているので残しておきますが、利用には注意してください。(2008年3月、新山) 目次背景知識形態素解析とは構文解析とは練習問題言語処理関係の論文によく出てくる重要語 1. 背景知識まず「形態素」、「構文」などといった用語は、ほとんどが現在の科学的な「言語学」という分野に帰するものであることを最初に知っておく必要がある。体系だった言語学は、おもにチョムスキー言語学の創始とともに始まった。チョムスキーは 1960年代に、世界じゅうの数多くの言語には、実はそのすべてに共通する「普遍文法 (universal grammer)」がある、と言った。またチョムスキーはそのような文法を数学的な人工言語で厳密に表現する方法をも開発した。彼によれば、言語にはその理想化されたかたち (言語が言い間違
bunhiko 2007/03/27
形態素解析

自然言語処理

学習
リンク
1