一个简单的词法分析程序

最近上《编译原理》这门课程,老师要求我们自己写一个词法分析程序。要求如下:

要求
要求

状态图

首先我们将文法转化为状态图~

状态图
状态图

符号表

然后我们建立好符号表~

类别编码 单词名称 类别编码 单词名称 类别编码 单词名称
1 const 11 end 20 >
2 var 12 read 21 :=
3 procedure 13 write 22 +
4 odd 14 变量名 23 -
5 if 15 数字 24 *
6 then 16 <> 25 /
7 while 17 <= 26 (
8 do 18 < 27 )
9 call 19 >= 28 ;
10 begin

代码

#include <iostream>
#include <fstream>
#include <string>
#include <cstring>
#include <cstdio>
#include <utility>
#include <vector>

using namespace std;

class LexicalAnalysis{

    static const vector<string> rwtab;

private:
    ifstream in;
    ofstream out;
    string buffer;
    vector<pair<int, string>> words;

    void readFile(){
        string tmp;
        while (! in.eof()){
            getline(in, tmp);
            buffer.append(tmp);
        }   
    }

public:
    LexicalAnalysis(){
        in.open("test.txt");
        readFile(); 
    }
    LexicalAnalysis(string address){
        in.open(address);
        readFile();
    }

    bool Scanner(){
        int len = buffer.length();
        int p = 0;
        char ch;
        while (p < len){
            int syn = 0;
            string token;
            ch = buffer[p++];
            while (p < len && ch == ' '){//过滤掉空格
                ch = buffer[p++];
            }
            if ('a' <= ch && ch <= 'z' || 'A' <= ch && ch <= 'Z'){ //以字母开头,可能为标识符或变量名
                while ((p < len) && ('a' <= ch && ch <= 'z' || 'A' <= ch && ch <= 'Z' || '0' <= ch && ch <= '9')){
                    token += ch; ch = buffer[p++];
                }
                p--;
                syn = 14;
                for (int i=0;i<13;i++){
                    if (rwtab[i] == token){
                        syn = i+1;
                    }
                }
            }
            else if ('0' <= ch && ch <= '9'){//数字
                while (p < len && '0' <= ch && ch <= '9'){
                    token += ch; ch = buffer[p++];
                }
                syn = 15;
            }
            else switch (ch){//其他字符
                case '<':
                    token += ch;
                    ch = buffer[p++];
                    if (ch == '>'){
                        token += ch; syn = 16;
                    }
                    else if (ch == '='){
                        token += ch; syn = 17;
                    }
                    else{
                        syn = 18; p--;
                    }
                break;

                case '>':
                    token += ch;
                    ch = buffer[p++];
                    if (ch == '='){
                        token += ch; syn = 19;
                    }
                    else{
                        p--; syn = 20;
                    }
                break;

                case ':':
                    token += ch;
                    ch = buffer[p++];
                    if (ch == '='){
                        token += ch; syn = 21;
                    }else{
                        return false;
                    }
                break;

                case '+': token += ch; syn = 22; break;
                case '-': token += ch; syn = 23; break;
                case '*': token += ch; syn = 24; break;
                case '/': token += ch; syn = 25; break;
                case '(': token += ch; syn = 26; break;
                case ')': token += ch; syn = 27; break;
                case ';': token += ch; syn = 28; break;

                default:
                    syn = -1;
                break;
            }
            if (syn > 0){
                words.push_back(make_pair(syn, token));
            }
        }
    }

    void Print(){
        for (int i = 0; i < words.size(); i++){
            std::cout << '(' << words[i].first << ',' << words[i].second << ')' << std::endl;
        }
    }
};


const vector<string> LexicalAnalysis::rwtab = {
    "const", "var", "procedure", "odd", "if", "then", "while", "do", "call", "begin", "end", "read", "write"
};

int main(){
    LexicalAnalysis test;
    test.Scanner();
    test.Print();
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容

  • 简介浏览器可以被认为是使用最广泛的软件,本文将介绍浏览器的工 作原理,我们将看到,从你在地址栏输入google.c...
    听风阁阅读 3,268评论 0 7
  • 转载说明 一、介绍 浏览器可以被认为是使用最广泛的软件,本文将介绍浏览器的工作原理,我们将看到,从你在地址栏输入g...
    17碎那年阅读 2,435评论 0 22
  • 目录一、介绍二、渲染引擎三、解析与DOM树构建四、渲染树构建五、布局六、绘制七、动态变化八、渲染引擎的线程九、CS...
    饥人谷_米弥轮阅读 2,452评论 0 10
  • 1. 介绍 浏览器可能是最广泛使用的软件。本书将介绍浏览器的工作原理。我们将看到,当你在地址栏中输入google....
    康斌阅读 2,006评论 7 18
  • 一个自诩为资深吃货、身材肥胖的中年妇女,逐渐成为我生活里不可或缺的一个人,每天早晨,一边吃早饭,一边看她公众号里推...
    空思我阅读 439评论 2 3