タグ

形態素解析に関するyuya_prestoのブックマーク (2)

  • 形態素 - Wikipedia

    形態素(けいたいそ、英: morpheme)とは、言語学の用語で、意味をもつ表現要素の最小単位。ある言語においてそれ以上分解したら意味をなさなくなるところまで分割して抽出された、音素のまとまりの1つ1つを指す。 形態素の一般的な性質や、形態素間の結びつきなどを明らかにする言語学の領域は、形態論と呼ばれる。 概要[編集] 形態素には、いくつかのタイプがあると考えた方が良いことが分かっている。またそれぞれの言語によっても違いがあらわれるので、ここではまず英語と日語での例を示す。 英語では、空白で区切られる単語 (英: word) よりも細かい単位である。たとえば、名詞の複数形の -s なども独立した形態素である。日語では、日語文法におけるいわゆる文節よりも細かい単位である、自立語(あるいは「詞」)と付属語(あるいは「辞」)および「接辞」が形態素である。 分類[編集] 機能的形態素[編集]

    形態素 - Wikipedia
  • 形態素解析の基礎

    形態素解析の基礎 大西 祥代,廣安 知之,三木 光範 ISDL Report  No. 20070913009 2007年 8月 28日 Abstract 形態素解析とは文章を単語に区切る処理であり,自然言語処理の最も基となる処理である.報告では,形態素解析に必要な技術形態素解析ツールについて述べる. 1  はじめに 近年, 自然言語で書かれた大量の文書が電子化され利用されている. 例えば, Web上では様々な情報をテキストや写真などで記述したページがある. また, 電子化されたアンケートなどは, データマイニングを行い経営などに活かされている. このように文書は電子化され今後もますます利用されると考えられるが, より効率良く利用するためにはコンピュータによる文書の解析が必要である. コンピュータが文書を解析するためには, 自然言語解析を行うが, 日語においては, 文章を単語に分

  • 1