タグ

自然言語処理とresearchに関するnaoeのブックマーク (3)

  • 言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改

    言語処理のための機械学習入門というが出版される、という話はtwitterで知っていたのだが、8月ぐらいに出るのだろうとばかり思っていたら、なんかもう発売されているらしい。Amazonでは早速売り切れていたので、某大学生協の書籍部まで行って購入してきた。おかげで、この週末は280円で過ごすハメになってしまった。 まだざっと眺めただけだが、 ラベルを人手でつけるのに隠れマルコフモデルと言うのは来はちょっとおかしいんだけどNLPの分野だとそう表現する事が多いよ 対数線形モデルと最大エントロピーモデルは同じものだよ 出力変数の間に依存関係がなければCRFではなく対数線形モデルとか最大エントロピーモデルと表現するべきだよ といった、これまでの教科書にはあまり載っていなかったような事が載っているのはとても良いと感じた。こういった情報は、これまではどこかの大学の研究室で学ぶか、もしくはウェブ上の資料

    言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改
  • 自然言語処理研究の現在の価値観とその問題点 - 武蔵野日記

    高村さんのページを見て考えさせられる。少し引用しておく。(NLP というのは自然言語処理のことである) 優秀な人材を有する民間企業を目前にし、研究機関としての大学の研究室の存在 意義がわからなくなっている人たち(特に若者)がいるようである。原因は、学 術界の迷走にある。学術界と産業界の間に来存在すべき境界線を彼ら彼女らに 見せることに、我々は失敗している。 このような状況において、今、自分が自分の思う方向にいくらかでも歩める立場 になった。とりあえずしばらくの間、次に述べるような方向性でやってみようと 思う。いくらかextremeであるが、燦々たる状況を考えると致し方ない。 1. NLP communityの現在の価値観に迎合しない。つまり、論文を会議に通すため の努力を最小限に抑える。通らなくても気にしない(ただし、自分の学生を徒に 危険に巻き込むわけにはいかないので、そこのバランスは

    自然言語処理研究の現在の価値観とその問題点 - 武蔵野日記
  • Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記

    最近次世代「検索」エンジンが登場しつつあるが、彼らのすごいところは検索結果ではない。たとえば Mathematica を作った会社が Wolfram|Alpha や最近検索に異様に力を入れている Microsoft が Bing を開発中だとアナウンスされたが、彼らが真にすごいのは、現在の自然言語処理(や情報検索などの周辺技術)の精度では恐らく不可能だと思えるようなことをやろうとしている、もしくはやっているところだと思う。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解析器を作っているので仕方な

    Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記
  • 1