タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

言語処理に関するillmaiのブックマーク (11)

  • チョムスキー階層 - Wikipedia

    チョムスキー階層(チョムスキーかいそう、Chomsky Hierarchy)は、形式言語を生成する形式文法の包含階層(「形式言語の階層」)で、「句構造文法(Phrase Structure Grammars)の階層」などとも言う。1956年にノーム・チョムスキーが発表した。 形式文法[編集] 形式文法の構成要素は、「終端記号」(Terminal Symbols)の有限集合(形式言語の単語で使われる文字)、「非終端記号」(Nonterminal Symbols)の有限集合、「生成規則」(Production Rules)の有限集合(各生成規則は右側と左側に記号列で構成される単語を含む)、「開始記号」(Start Symbol)から構成される。生成規則はある単語に適用され、規則の左側にある単語を右側にある記号列で置換する。導出は一連の規則適用過程である。このような文法で開始記号から始めて生成規

  • HTK 3.0 HOWTO (工事中)

    データ作成 HTKDemoの離散HMM(状態数:3, VQcodebook:64-64-16(Linear))を参考に使い方を一通り眺めてみる. tidata/ TIMIDデータベースより10文(7文:training,3文:testing) 発音記号ファイル(tidata/*.phn) →[HLEd, (edfiles/*.led)] → ラベルファイ ル(label/bcplabs/mon/*.lab) 音声ファイル(tidata/*.adc) →[HCopy]→ 特徴量ファイル(data/*/*.mfc) ネットワークファイル monNetworkを編集 % HParse networks/monNetwork(gram) networks/monLattice(wdnet:Standard Lattice Format(SLF)) networks/monNetwork $phn

  • メモ:普遍文法の知識はどこまで言語固有か?−ミニマリストプログラムがやろうとしていること - 誰がログ

    killhiguchiさんの以下のエントリでのコメントに対する僕なりの回答です。 『日語に主語はいらない』に突っ込む:(6)理論がコロコロ変わり過ぎなんだよ! - 思索の海 少々答えが長くなりますし、引用なども使いたいので別エントリでたてました。なんかタイトルが一冊のすらかけそうなほど壮大ですが、ここでの内容を端的に表すタイトルを考えるのが難しくて…期待して記事を開いてくださった方々、すいません(^^;そして少しでもkillhiguchiさんへのお答えになっていればいいのですが… さて、killhiguchiさんの問いは以下のようなものでした。 http://mixi.jp/view_bbs.pl?id=21639848&comment_count=5&comm_id=54058 >ミニマリストの流れは「UGの最小化」であって、理想的には生得的言語知識をゼロにすることなのです。 UGの

    メモ:普遍文法の知識はどこまで言語固有か?−ミニマリストプログラムがやろうとしていること - 誰がログ
  • 189 X バー理論による音節の分析* 太 田  聡 山口大学 1. 序  この論文の目的は,次の三つの主張を行うことである. (i) 音節(syllable)の内 構成素で普遍的とされてきたライム(rime)

  • Xバー理論 - Google 検索

    Xバー理論 (エックスバーりろん、英: X-bar theory) とは、1950年代にノーム・チョムスキーが提唱した生成文法理論に基づき、1970年代から1980年代に発展した、句範疇 ...

  • 本文

  • 木接合文法 - Wikipedia

    木接合文法(英: Tree-Adjoining Grammar、TAG)とは、アラビンド・ジョシ(英語版) らによる、形式文法の一種である。文脈自由文法にいくぶん似ているが、シンボルの書き換えではなく、木の書き換えをベースとすることが特徴で、文脈自由文法は、シンボルの書き換えのための生成規則群から成るが、木のノード群を書き換える規則群から成る(木および木構造参照)。 概要[編集] TAGにおける規則は、foot node と呼ばれる特殊な葉ノードを持つ木であり、foot node には単語が付属している。TAGにおける木は2種類に分類される。initial(初期)木('' とも)と auxiliary(補助)木('')である。初期木は基的な結合価的関係を表し、補助木は再帰を許容する[1]。補助木には根ノードがあり、foot node は初期木と同じシンボルがラベルとして付けられている。導

  • 生成文法 - Wikipedia

    生成文法(せいせいぶんぽう、英: generative grammar)は、ノーム・チョムスキーの 『言語理論の論理構造』(The Logical Structure of Linguistic Theory、1955/1975)、 『文法の構造』(Syntactic Structures、1957)といった著作や同時期の発表を契機として起こった言語学の理論である。 概論[編集] チョムスキーの示したドグマ・ドクトリンとしては、脳の言語野に損傷を持たない人間は幼児期に触れる言語が何であるかにかかわらず驚くほどの短期間に言語獲得に成功するが、これは言語の初期状態である普遍文法(英: universal grammar, UG)を生得的に備えているためであると考える。生成文法の目標は、定常状態としての個別言語の妥当な理論を構築し(記述的妥当性)、第一次言語獲得における個別言語の獲得が成功する源

    生成文法 - Wikipedia
  • 言語学の基礎

    この文書は、MacOS X上で、上山大輔氏の開発したテキストエディタmi、および、浅海智晴氏の開発した文書処理システムSmartDocを使用して作成しています。これらのソフトを開発し、無償で利用させて下さっている両氏に深く感謝致します。

  • 形態素解析 - Wikipedia

    語の代表的な形態素解析の手法[編集] 英語の場合と異なり、文節を得るのが目的となることが多い。大まかに言えば文から切り出した単語が属する品詞を辞書(自然言語処理用の)を用いて調べていき、結果得られた並びから正しく文節が構成される並びであるものを正解であるとするといったような方法を取る。 日語文法では、たとえば動詞のあとに格助詞がくることはできない(「ドアを開けるを」などは不可)といったように、ほとんどの付属語について「このようなものの後には付く」「このようなものの後には付かない」という規則性があり、また動詞の活用はその後に来る品詞を制限することがある(たとえば連体形の後は名詞)。このような性質を利用することによって単語の境界の判別を行う。具体的にこの性質を利用する方法には以下の2つがある: 規則による方法 確率的言語モデルをもちいる方法 規則による形態素解析[編集] 長尾真らの197

    形態素解析 - Wikipedia
  • MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析エンジン)

    MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった 一部のコンパイラで正しくコンパイルできなかった問題の修正 部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-

  • 1