タグ

ブックマーク / ja.wikipedia.org (4)

  • 字句解析 - Wikipedia

    トークンは字句解析する段階では、プログラムの要素としての妥当性は必ずしも考慮されない。例えば上記の例で sum は、もしこの文の前にsumが宣言されていなければ意味がないが、字句解析器は通常トークンとしては問題ないとして扱う。 一方、数リテラルの値が、そのプログラミング言語で扱えるいかなる型がサポートする範囲よりも大きい値が書かれている場合は、最初からエラーにすることもある。 [注釈 1] 字句解析器[編集] スキャナ[編集] 一般に、文字列をなめるような処理をするものをスキャナという。字句解析の場合、文字列から、1個のトークンになるような部分文字列を切り出す部分をスキャナとして分けて考える場合がある。 スキャナはある種の有限状態機械にモデル化できる。その有限状態機械は、それが処理する任意のトークンに含まれる文字の考えられる並びに関するルールを元に生成される。ここでいうルールとは例えば、「

  • 構文解析器 - Wikipedia

    構文解析器(こうぶんかいせきき)とは、構文解析をおこなうプログラム。パーサまたはパーザ[1] (parser)とも。プログラミング言語処理系の入力部分が代表的であるが、それに限らず設定ファイルの読み込みなど、構造を持った入力テキストの処理を行う。自然言語処理でも使われる。 構文解析のアルゴリズムには複雑なものも多いが[2]、パーサジェネレータの研究は盛んであり、そういったものを使用すれば、構文規則を記述するだけで構文解析器を自動的に生成できる(プログラムのソースコードが出力される)。 構文解析器の種類[編集] 構文解析器の役割は基的に、開始記号に形式文法の規則を適用することで入力された文字列が得られるかどうかを判定することである。これは次の2種類の手法で行われる: トップダウン構文解析 - 構文解析器は開始記号を始点として、それを変換していって入力された文字列を得ようとする。直観的に言え

  • 構文解析 - Wikipedia

    構文解析(こうぶんかいせき、英語: parsing, syntactic analysis, syntactic analysis)は、ある言語において、その形式文法に従って記号の文字列を分析する手続きである。構文解析を行う機構を構文解析器(parser)と呼ぶ。 概要[編集] 文章(具体的にはマークアップなどの注記の入っていないベタの文字列)を対象として、 自然言語であれば、形態素に切分け、さらにその間の関連(修飾-被修飾など)といったような、統語論的関係を図式化するなどして明確化・解析する手続きである。 プログラミング言語など形式言語の場合は、形式文法に従い構文木を得る手続きである。 形式言語[編集] プログラミング言語の場合は一般にその性質から、文字列(ソースコード)から字句(トークン)の列を取り出す前処理段階である字句解析(lexical analysis)と、そのトークン列を受け

  • ISO 3166-1 - Wikipedia

    赤字: 国名コード(alpha-2) ISO 3166-1は、ISOによって発行されているISO 3166の第一の部分で国名コードの標準。日ではJIS X 0304として標準化されている。国、保護領、および特定の地政学的な意味を持つ地域の名前に対し、以下の3種の国名コードを定義している。 ISO 3166-1 alpha-2: ラテン文字2文字による国名コード。3種のコードのうち最も使用されており、「.jp」等インターネットでの国別コードトップレベルドメインとしてよく知られている(ただし、一部例外がある) ISO 3166-1 alpha-3: ラテン文字3文字による国名コード。上記alpha-2よりも国名コードからラテン文字表記の国名が類推しやすくなっている ISO 3166-1 numeric: 3桁の数字による国コード。国際連合統計部(英語版)により定義、保守されているUN M.4

    ISO 3166-1 - Wikipedia
  • 1