Java实现正则式转MFA

//要求正则式中不含有空集或空串,程序不检查符号是否合法
//NFA初始开始状态记为0,终止状态记为1,新增的状态用2,3,...表示,存储结构为(起点状态,终点状态,正则式)三元组的列表
//假设没有不可达状态和死状态
package compiler;

import java.util.Arrays;
import java.util.HashSet;
import java.util.LinkedList;
import java.util.Scanner;
import java.util.Set;

class triple {
    int start, end;
    String regex;

    public triple(int i, int j, String init) {
        start = i;
        end = j;
        regex = init;
    }

    @Override
    public String toString() {
        return start + "," + regex + "->" + end;
    }

    @Override
    public boolean equals(Object arg0) {
        if(arg0 == null || arg0.getClass() != this.getClass()) return false;
        triple t = (triple)arg0;
        return start==t.start&&end==t.end&&regex.equals(t.regex);
    }
}

public class RegexToMFA {

    static String regex;
    static LinkedList<triple> nfa;
    static LinkedList<Integer> finalStates;
    static LinkedList<triple> dfa;
    static Set<Character> chars;
    static int mfaStart;
    static LinkedList<Integer> mfaFinal;
    static LinkedList<triple> mfa;

    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        regex = sc.nextLine().trim();
        sc.close();
        if (regex.length() == 1) {
            System.out.println("MFA:初态0,终态1,(0," + regex + ")->1");
            return;
        }
        regexToNFA();
        System.out.println("NFA:初态0,终态1");
        for (triple t : nfa)
            System.out.println(t);
        NFAtoDFA();
        System.out.println("DFA:初态0,终态" + finalStates);
        for (triple t : dfa)
            System.out.println(t);
        DFAtoMFA();
        System.out.println("MFA:初态"+mfaStart+",终态"+mfaFinal);
        for (triple t : mfa)
            System.out.println(t);
    }

    static void regexToNFA() {
        nfa = new LinkedList<>();
        nfa.add(new triple(0, 1, regex));
        int state = 2;
        boolean loop = true;// 每轮迭代对nfa中的一个映射应用规则拆分,直到不能再拆分为止
        while (loop) {
            loop = false;
            // 遍历映射,若拆分,loop=true,跳出
            // pattern1,2,3检查不可调换顺序
            for (triple t : nfa) {
                int s = t.start, e = t.end;
                String reg = t.regex;
                if (reg.length() <= 1)
                    continue;// 不能拆分
                // 去括号
                if (reg.charAt(0) == '(') {
                    int bracketCnt = 1;
                    for (int i = 1; i < reg.length(); ++i) {
                        if (reg.charAt(i) == '(')
                            bracketCnt++;
                        if (reg.charAt(i) == ')') {
                            bracketCnt--;
                            if (bracketCnt == 0) {
                                if (i == reg.length() - 1)
                                    t.regex = reg.substring(1, i);
                                break;
                            }
                        }
                    }
                }
                reg = t.regex;
                int i;
                if ((i = isPattern1(reg)) != -1) {
                    nfa.remove(t);
                    nfa.add(new triple(s, e, reg.substring(0, i)));
                    nfa.add(new triple(s, e, reg.substring(i + 1)));
                    loop = true;
                    break;
                }
                if ((i = isPattern2(reg)) != -1) {
                    nfa.remove(t);
                    nfa.add(new triple(s, state, reg.substring(0, i)));
                    nfa.add(new triple(state, e, reg.substring(i)));
                    state++;
                    loop = true;
                    break;
                }
                if (isPattern3(reg)) {
                    nfa.remove(t);
                    nfa.add(new triple(s, state, ""));
                    nfa.add(new triple(state, e, ""));
                    nfa.add(new triple(state, state, reg.substring(0, reg.length() - 1)));
                    state++;
                    loop = true;
                    break;
                }
            }
        }
    }

    static int isPattern1(String regex)// 若符合规则,返回|的下标,否则返回-1
    {
        int bracketCnt = 0;
        for (int i = 0; i < regex.length(); ++i) {
            if (regex.charAt(i) == '(')
                bracketCnt++;
            if (regex.charAt(i) == ')')
                bracketCnt--;
            if (regex.charAt(i) == '|' && bracketCnt == 0)
                return i;
        }
        return -1;
    }

    static int isPattern2(String reg)// 若符合规则,返回e2开始处的下标,否则返回-1
    {
        if (reg.charAt(0) != '(')// 字符开头
        {
            if (reg.charAt(1) == '*')
                return reg.length() == 2 ? -1 : 2;
            return 1;
        } else// 左括号开头
        {
            int bracketCnt = 1;
            for (int i = 1; i < reg.length(); ++i) {
                if (reg.charAt(i) == '(')
                    bracketCnt++;
                if (reg.charAt(i) == ')') {
                    bracketCnt--;
                    if (bracketCnt == 0) {
                        if (reg.charAt(i + 1) == '*')
                            return reg.length() == i + 2 ? -1 : i + 2;
                        return i + 1;
                    }
                }
            }
        }
        return -1;
    }

    static boolean isPattern3(String reg) {
        if (reg.length() == 2 && reg.charAt(1) == '*')// a*
            return true;
        // 相匹配的(...)* 匹配条件:左括号开始计数1,往后左加右减,若减到0时是最后一个右括号,成功
        if (reg.charAt(0) == '(' && reg.endsWith(")*")) {
            int bracketCnt = 1;
            for (int i = 1; i < reg.length() - 1; ++i) {
                if (reg.charAt(i) == '(')
                    bracketCnt++;
                if (reg.charAt(i) == ')') {
                    bracketCnt--;
                    if (bracketCnt == 0)
                        return i == reg.length() - 2;
                }
            }
        }
        return false;
    }

    static void NFAtoDFA() {
        finalStates = new LinkedList<>();
        dfa = new LinkedList<>();
        Integer[] I = getClosure(new Integer[] { 0 });
        getChars();
        LinkedList<Integer[]> newStates = new LinkedList<>();
        newStates.add(I);
        for (Integer i : I)
            if (i == 1) {
                finalStates.add(0);
                break;
            }
        LinkedList<Integer[]> toCalc = new LinkedList<>(newStates);
        while (!toCalc.isEmpty()) {
            Integer[] arr = toCalc.poll();
            for (Character c : chars) {
                Integer[] tmp = getReachStates(arr, c);
                Integer[] reachClosure = getClosure(tmp);
                if (!have(newStates, reachClosure)) {
                    newStates.add(reachClosure);
                    toCalc.add(reachClosure);
                    for (Integer i : reachClosure)
                        if (i == 1) {
                            finalStates.add(newStates.size() - 1);
                            break;
                        }
                }
                int s = getIndex(newStates, arr);
                int e = getIndex(newStates, reachClosure);
                triple t = new triple(s, e, c + "");
                dfa.add(t);
            }
        }
    }

    static Integer[] getClosure(Integer[] arr) {
        Set<Integer> closure = new HashSet<>();
        for (Integer start : arr)
            closure.add(start);
        LinkedList<Integer> tocheck = new LinkedList<>(closure);
        while (!tocheck.isEmpty()) {
            int start = tocheck.poll();
            for (triple t : nfa)
                if (t.start == start && t.regex.equals("")) {
                    closure.add(t.end);
                    tocheck.add(t.end);
                    break;
                }
        }
        return closure.toArray(new Integer[closure.size()]);
    }

    static void getChars() {
        chars = new HashSet<>();
        for (int i = 0; i < regex.length(); ++i) {
            char c = regex.charAt(i);
            if (c != '(' && c != ')' && c != '|' && c != '*')
                chars.add(c);
        }
    }

    static Integer[] getReachStates(Integer[] arr, Character c) {
        Set<Integer> reachStates = new HashSet<>();
        for (Integer i : arr)
            for (triple t : nfa)
                if (t.start == i && !t.regex.isEmpty() && t.regex.charAt(0) == c) {
                    reachStates.add(t.end);
                    break;
                }
        return reachStates.toArray(new Integer[reachStates.size()]);
    }

    static int getIndex(LinkedList<Integer[]> newStates, Integer[] arr) {
        for (int i = 0; i < newStates.size(); ++i)
            if (Arrays.equals(newStates.get(i), arr))
                return i;
        return -1;
    }

    static boolean have(LinkedList<Integer[]> newStates, Integer[] arr) {
        for (int i = 0; i < newStates.size(); ++i)
            if (Arrays.equals(newStates.get(i), arr))
                return true;
        return false;
    }
    
    static void DFAtoMFA()
    {
        mfaStart = 0;
        mfaFinal = finalStates;
        mfa = new LinkedList<>(dfa);
        Set<Integer> allStates = new HashSet<>();
        allStates.add(0);
        for(triple t: dfa)
            allStates.add(t.end);
        int n = allStates.size();
        allStates.removeAll(finalStates);
        LinkedList<Integer> nonFinal = new LinkedList<>(allStates);
        boolean[][] table = new boolean[n][n];
        for(int i=0; i<n; ++i)
            for(int j=0; j<n; ++j)
                table[i][j] = true;
        for(int i=0; i<n; ++i)
            for(int j=0; j<n; ++j)
                if(j!=i && ((finalStates.contains(i)&&nonFinal.contains(j)) || (nonFinal.contains(i)&&finalStates.contains(j))))
                    table[i][j] = false;
        boolean flag = true;
        while(flag)
        {
            flag = false;
            for(int i=0; i<n; ++i)
                for(int j=0; j<n; ++j)
                    if(j!=i && table[i][j])
                        for(char c: chars)
                        {
                            boolean ihasTrans = false, jhasTrans = false;
                            int iTrans = 0, jTrans = 0;
                            for(triple t: dfa)
                                if(t.start==i && t.regex==c+"")
                                {
                                    ihasTrans = true;
                                    iTrans = t.end;
                                    break;
                                }
                            for(triple t: dfa)
                                if(t.start==j && t.regex==c+"")
                                {
                                    jhasTrans = true;
                                    jTrans = t.end;
                                    break;
                                }
                            if((ihasTrans&&!jhasTrans) || (!ihasTrans&&jhasTrans) || (ihasTrans&&jhasTrans&&!table[iTrans][jTrans]))
                            {
                                table[i][j] = false;
                                flag = true;
                                break;
                            }
                        }
        }
        for(int i=0; i<n; ++i)
            for(int j=0; j<n; ++j)
                if(j!=i && table[i][j])
                {
                    for(triple t: dfa)
                        if(t.start==j || t.end==j) 
                        {
                            mfa.remove(t);
                            if(t.start == j) t.start = i;
                            if(t.end == j) t.end = i;
                            if(!mfa.contains(t))
                                mfa.add(t);
                        }
                    if(mfaStart==j) mfaStart=i;
                    mfaFinal.remove(j);
                    table[i][j] = false;
                    table[j][i] = false;
                }
    }   
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容