タグ

言語に関するtkmkzのブックマーク (3)

  • 形態素解析 - Wikipedia

    形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。 自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。 もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上の自然言語処理としてコンピュータでの扱いやすさに主眼を置いた解析もある。以下は後者のためのツールを

    形態素解析 - Wikipedia
    tkmkz
    tkmkz 2012/07/11
    分かち書きの無い日本語は大変。
  • 異分析 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "異分析" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2020年6月) 異分析(いぶんせき)は、誤解に基づいて、ある語に来の語源・語構成と異なる解釈を行うことをいう。「異分析」(英語: metanalysis < meta- + analysis)という用語はオットー・イェスペルセンが考案したものだが、元々は文の構造を別の構造として解釈することを含んでいた。現在はこれは再分析あるいは再解釈と呼ばれ、異分析には含めない。 民間語源は異分析に基づくものが多い。例えば、「あかぎれ」は「赤切れ」と思われているが、元の「あかがり」の「あ」は「足

    tkmkz
    tkmkz 2011/09/29
    つまり:単語の区切り目がわけわからんもの
  • J-CASTトレンド

    女優の戸田恵梨香さんが2020年2月5日、自身のインスタグラムで、俳優の松下洸平さんと子役の中須翔真...

    J-CASTトレンド
    tkmkz
    tkmkz 2011/08/11
    言語権…かぁ
  • 1