js正则表达式总结
-
正则表达式的字符匹配
量词横向模糊匹配
var regex = /ab{2,5}/g
g
表示全局匹配,意味着找到目标字符串中所有匹配的子串,若是不加的话,则只会找到第一个匹配的子串{m,n}
表示连续出现最少m次,最多n次{m,}
表示最少出现m次?
等价于{0,1}
表示出现1次或者不出现+
等价于{1,}
表示最少出现1次*
表示出现任意次,有可能不出现量词会有贪婪匹配和惰性匹配,
一般情况下是贪婪匹配,尽量的想要的更多,比如{2,5}
会尽量的去匹配5个,意味着想要一次性吃饱惰性匹配,虽然2到5次都行,但是当2个就够的时候,就不在往下尝试了,意味着有吃的就好,惰性匹配模式在量词后面加个?就好,
{m,n}? {m,}? ?? +? *?
字符组
虽然是叫做字符组,但只是其中的一个字符,例如[abc],表示匹配一个字符,它可以是"a","b","c"之一[abc]表示一个除"a","b","c"之外的任意一个字符,字符组的第一位放,表示求反的概念
\d 就是[0-9] 表示一位数字 \D 就是[^0-9] 表示除数字之外的任意字符 \w 就是[0-9a-zA-Z_] 表示数字大小写字母和下划线,也称单词字符 \W 就是[^0-9a-zA-Z_] 表示任意一个非单词字符 \s 就是[ \t\v\n\r\f] 表示空白符 \S 就是[^ \t\v\n\r\f] 表示任意一个非空白符 . 通配符,任意一个字符
也可以使用[\d\D],[\w\W],[\s\S],[^]表示任意一个字符
多选分支
多选分支可以支持多个子模式任选其一,形式如下:(p1|p2|p3)
分支结构也是惰性的,当p1匹配上时,就不会再去尝试匹配p2,p3了
-
正则表达式的位置匹配
位置就是相邻字符之间的地方,在正则中共有6个位置字符
^ 匹配开头,在多行模式中匹配行开头 $ 匹配结尾,在多行模式中匹配行结尾 \b 是单词边界,单词与非单词之间的位置,具体就是\w和\W之间的位置,\w与^之间的位置,\w与$之间的位置 \B 表示非单词边界,就是这个位置两边要么都是单词,要么都不是单词,具体就是\w与\w,\W与\W ^与\W \W与$之间的位置 (?=p) p表示一个子模式,即这个模式之前的位置,也就是说这个位置之后就是这个子模式的匹配结果 (?!p) 这个位置之后不是子模式
-
正则表达式括号的作用
括号在正则中的作用如下
分组和分支结构 捕获分组 反向引用 非捕获分组
分组和分支结构
/(ab)+/
括号提供分组的功能,是+作用于“ab”这个整体/^I Love (Javascript|regular Expression)$/
括号组成了一个分支结构引用分组
有个引用分组,我们就可以进行数据提取,以及更强大的替换操作var regex = /(\d{4})-(\d{2})-(\d{2})/; var string = "2017-06-12"; console.log( string.match(regex) ); // ["2017-06-12", "2017", "06", "12", index: 0, input: "2017-06-12"] 正则表达式后面没有g的话,会返回匹配的子串以及各个分组, 但是有g的话,只会返回匹配的子串,不会返回分组 var regex = /(\d{4})-(\d{2})-(\d{2})/g; // ["2017-06-12"] 替换 var result = string.replace(regex, "$2/$3/$1"); 反向引用 可以保证后面的模式与前面的一致 var regex = /\d{4}(-|\/|\.)\d{2}\1\d{2}/; 非捕获分组 只想要括号最原始的功能,但不会引用它,此时可以使用非捕获分组(?:p),等于(p)
- 正则表达式的几种使用场景
1,验证
regex.test(string)
string.search(regex)
string.match(regex)
regex.exec(string)
2,切分
string.split(regex)
3,提取
string.match(regex)
正则不要加g
regex.exec(string)
4,替换
string.replace(regex,function(){})
"1234 2345 3456".replace(/(\d)\d{2}(\d)/g, function(match, $1, $2, index, input) { console.log([match, $1, $2, index, input]); }); // => ["1234", "1", "4", 0, "1234 2345 3456"] // => ["2345", "2", "5", 5, "1234 2345 3456"] // => ["3456", "3", "6", 10, "1234 2345 3456"]
- 正则表达式的几种使用场景