タグ

自然言語処理に関するlan_tasoのブックマーク (3)

  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品

  • DO++: 機械学習による自然言語処理チュートリアル

    自然言語処理のときに使う機械学習手法のテクニックをざーっと2時間程度で紹介してほしいとのことだったので今日話してきました。基的に、そんなに頑張らなくても効果が大きいものを中心に説明(特にパーセプトロンとか)を説明してます。 紹介した手法はパーセプトロン、最大エントロピー、正則化、多クラス分類、系列分類(CRF, Structured Perceptron)などなどです。どれも一かじりする感じで網羅的に見る方を優先してます。個々の詳しい話はそれぞれの文献や実装などを当たってみてください。 スライド [ppt] [pdf] ここで話しているのは線形識別モデルの教師有り学習が中心で教師無し学習(クラスタリングなど)など他の自然言語処理を支える技術は省いてます。 こういうのを使って(使わなくてもいいけど)どんどんアプリケーション作らないといかんね。 Tarot is not used to ma

    DO++: 機械学習による自然言語処理チュートリアル
  • リンクシンクの言語処理 (LINKTHINKTANK)

    どーも、リンクシンク正法地です。 BlogPetの開発を担当してます。 特にペットの発言や占い等の、言語処理が必要な部分をメインで担当してます。 また、他のサービス(開発中のものも含めて)でも言語処理が必要な部分は、基的に私が企画やら開発なんかを担当してます。 今も、ちょっとテストで作っているものがあるのですが、それもやっぱり言語処理系です。 言語処理といえば…、弊社で開発しているブログパーツのBlogPet(の一部)やサンエックスブログキャラでの形態素解析(日語の分解など)は、自社開発したオリジナルの形態素解析システムが動いてたりするんですよ。 まだ、分かち書きや漢字の読み変換、品詞の抽出程度しか出来ませんが、そのうち意味解析や係り受け、感情分析などの仕組みを実装したいなという大きな野望のもと、日々手を入れてます。 プログラムが人間を超える日は近いのかもしれませんよ!(無理)

  • 1