タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

字句解析に関するblack-aquaのブックマーク (5)

  • C言語 予約語一覧 [ if, else, switch, for, while, continue, goto, return, ... ] | 勇躍のゴミ箱

    C言語 目的別 画面への文字出力 画面へ1文字単位で出力 画面へ1行単位で出力 画面へ書式付きで出力 可変個引数を書式付き表示 キーボードから文字入力 入力を1文字単位で取得 入力を1行単位で取得 入力を書式付きで取得 ストリームに1文字戻す 文字列データの入出力 文字列から書式付きで取得 文字列へ書式付きで出力 可変個引数を書式付き出力 ファイルオープン ファイルを開く ファイルを閉じる ファイルオープンのモード 標準入出力について ファイルの読み込み テキストファイルの読込 空白区切りファイルの読込 CSVファイルの読込 バイナリファイルの読込 ファイルの書き込み テキストファイルの書込 CSVファイルの書込 バイナリファイルの書込 可変個引数をファイルへ書込 ファイル関連 ファイル位置の取得 ファイル位置の設定 ファイル位置の取得2 ファイル位置の設定2 ファイル位置を先頭に戻す フ

  • コンパイラの入り口、「字句解析」のための文字列操作

    前回はBNFでプログラム言語S1sを定義しました。今回は、この定義に従って記述されたプログラムをコンパイルするに当たり、最初に実行する処理である字句解析について解説をします。 「字句解析」とは何ぞや? 前回、プログラミング言語S1sを次のように定義しました。 <program> ::= main '{' <expression> '}' <expression> ::= <term>{ <opeas> <term> } <term> ::= <factor>{ <opemd> <factor> } <factor> ::= <number>|( <expression> ) <number> ::= <digit>{<digit>} <opeas> ::= + | - <opemd> ::= * | / <digit> ::= 0|1|2|3|4|5|6|7|8|9 この定義から、S1sの

    コンパイラの入り口、「字句解析」のための文字列操作
  • C入門/トークンと文 - WisdomSoft

    C 言語のトークンと文について解説します。コードに書かれているすべての文字並びや記号はトークンという最小単位に分解できます。複数のトークン並びは文と呼ばれる最小の実行単位となります。 どんなに複雑に書かれたプログラムも、トークン(token)と呼ばれる最小単位のテキストに分解することができます。トークンは、それ以上分解することができないプログラムの最小単位であり、英語における英単語に相当するものです。プログラミング言語の命令となる文は、複数のトークンによって構成されています。 プログラミング言語を機械語に翻訳するまでにいくつかの工程を挟みます。コンパイラに入力されたテキストは、ソースコードに書かれたテキストが C 言語で定めている文法に従っているかどうかを調べるためにトークンの列に分解されます。この工程を字句解析と呼びます。 トークンにはいくつか種類があり、プログラミング言語の仕様で定めら

  • C言語-字句解析

    グローバル変数 char *gt_line; 1行分の文字列を格納しておく (MAX=256文字) char *token; 取り出した単語が格納される 例えば、次の1行を変数gt_lineに格納する。 2.1 + 3 + 4.33 + 5e2 最初にget_token()を呼び出すと、変数tokenには、2.1が格納される。次に呼び出すと空白は無視されて+が格納される。次に3, +, 4.33, +, 5e2 と順に格納され、最後は\0(ナル)が格納される。 この様子を図で示すと次のようになる。pは配列gt_lineを、ptkは配列tokenを操作するポインタ変数である。 ① ポインタ変数pの内容が数字であるので、数字以外の文字が現れるまで1文字ずつ変数tokenに格納しながら進める。 ② 数字以外の文字が現れた時点で変数tokenの最後に\0を付加し、変数gt_lineにはポインタ変数

  • C言語/記法 - Wikibooks

    このページでは、C言語の記法に関する情報を網羅するよう心掛けました。 文字集合[編集] ISO/IEC 9899:2011(通称 C11)の §5.2.1 Character sets の冒頭を抄訳/引用します。 (C言語の処理系実装者は)2つの文字セットとそれに関連する照合順序( collating sequences )を定義しなければなりません[1]。 ソース文字セット(the source character set; ソースファイルを記述するための文字セット)と、実行文字セット(the execution character set; 実行環境で解釈される文字セット)です[1]。 それぞれのセットはさらに、基文字セット( basic character set )と、拡張文字と呼ばれる0個以上の地域固有のメンバー(基文字セットのメンバーではない)のセットに分けられます[1]。

  • 1