正则表达式方法示例
- test方法解析,test判断正则是否在字符串中出现过,如果出现返回true,如果没出现返回false。
let str = 'hello world';
let reg1 = /e/.test(str); // true
let reg2 = /q/.test(str); // false
如:判断是否谷歌浏览器: /Chrome/g.test(navigator.userAgent) //返回true或false
- exec方法解析,exec跟match方法类似,也是返回匹配到的数组,如果没有匹配成功也是返回null。
let str = 'hello world';
let arr1 = /e/.exec(str) // ["e"]
let arr2 = /q/.exec(str); // null
区别在于exec方法在全局模式下,可以多次调用返回不同的值信息,如下:
let str = 'hello world';
let re = /l/g;
let arr1 = re.exec(str); // ["l", index: 2, input: "hello world", groups: undefined]
let arr2 = re.exec(str); // ["l", index: 3, input: "hello world", groups: undefined]
let arr3 = re.exec(str); // ["l", index: 9, input: "hello world", groups: undefined]
let arr4 = re.exec(str); // null
当匹配不到结果的时候,才会返回null,所以在有g的情况下使用的时候要额外的小心,其实test方法也是具备这个特性的,例如:
let str = 'hello world';
let re = /e/g;
let reg1 = re.test(str); // true
let reg2 = re.test(str); // false
let reg3 = re.test(str); // true
let reg4 = re.test(str); // false
模式修饰符
正则表达式为了改变模式的一些行为,提供了模式修饰符,常见的模式修饰符如下:
g 修饰符
i 修饰符
m 修饰符
u 修饰符
y 修饰符
s 修饰符
g 修饰符
全局匹配,找到所有匹配,而不是第一个匹配成功后就结束。
let str = 'hello world';
let arr = str.match(/l/g); // ["l", "l", "l"]
会找到整个字符串中所有出现过的l字符,g修饰符的目的就是从头匹配到尾,不管匹配过程中是成功还是失败。
i 修饰符
忽略大小写,默认情况下是区分大小写的。
let str = 'hello world';
let reg1 = /E/.test(str); // false
let reg2 = /E/i.test(str); // true
m 修饰符
可以执行多行匹配,作用是修改^和$在正则表达式中的作用,让它们分别表示行首和行尾。在默认状态下,一个字符串无论是否换行只有一个开始^和结尾$,如果采用多行匹配,那么每一个行都有一个^和结尾$。
let str = 'hello\n world';
let reg1 = /hello$/.test(str); // false
let reg2 = /hello$/m.test(str); // true
u 修饰符
意思是“Unicode模式”,用于正确处理大于\ uFFFF的 Unicode字符。这就是说,4字节的UTF-16编码将被正确地处理。
let str = '\uD83D\uDC2A';
let reg1 = /^\uD83D/.test(str); // true
let reg2 = /^\uD83D/u.test(str); // false
在上述代码中,\uD83D\uDC2A是4字节的UTF-16编码,它代表一个字符。然而,ES5并不支持4字节的UTF-16编码,当它被识别为两个字符时,结果为 true。在加入 u修饰符之后,ES6将识别出它是字符,因此第一行代码的结果是 false。添加了一个u修饰符号之后,下面这些正则表达式的行为被修改。
y 修饰符
类似于g修饰符,也是全局匹配,后者将从上次匹配成功的下一个位置开始。区别在于, g修饰符只要在余下的位置上存在匹配,而 y修饰符则确保匹配必须从剩下的第一个位置开始,这就是粘连的含义。
var s = 'aaa_aa_a';
var r1 = /a+/g;
var r2 = /a+/y;
r1.exec(s) // ["aaa"]
r2.exec(s) // ["aaa"]
r1.exec(s) // ["aa"]
r2.exec(s) // null
上述代码包含两个正则表达式,一个使用 g修饰符,另一个使用 y修饰符。那两个正则表达式分别执行两次,第一次执行时,它们表现相同,剩下的字符串都是_aa_a。因为 g修饰不需要位置,因此第二次执行返回结果,而 y修饰符要求匹配必须从头部开始,因此返回 null。
s 修饰符
dotAll模式,匹配任何字符(包括终止符\n)。这个的目的是解决不能匹配终止符的问题。
/foo.bar/s.test('foo\nbar') // true
转义字符
一、转义符在正则中主要有两种方法:
- 表示正则中的一些特殊含义的功能。
- 表示跟正则语法冲突的字符形式。
二、常见的特殊含义功能有:
. 匹配除换行符以外的任意单个字符
\ 转义字符
* 匹配前面的模式零次或多次
+ 匹配前面的模式一次或多次
\? 匹配前面的模式零次或一次,即可选
| 逻辑或
\^ 匹配字符串的开始
\$ 匹配字符串的结束
\d 匹配数字
\D 匹配非数字
\s 匹配空格
\S 匹配非空格
\w 匹配字符
\W 匹配非字符
\b 匹配端点
\B 匹配非端点
例:
let str = 'hello world';
let reg1 = /\w/.test(str); // true
let reg2 = /\bhello\b/.test(str); // true
let str2 = 'hello?world';
let reg3 = /hello?world/.test(str2); // false
let reg4 = /hello\?world/.test(str2); // true
三、转义字符的注意点:
- 转义字符需要使用反斜杠(\)来表示,但是在JavaScript中,反斜杠本身也需要转义,所以在写代码时,需要使用两个反斜杠表示一个反斜杠。
- 转义字符会改变原有的字符含义,必须非常小心。如果使用不当,可能会导致匹配结果与预期不符。
- 转义字符可以组合成复杂的模式,用来匹配更加复杂的文本。
- 转义字符的效率相对较低,使用次数越多,效率越低。如果能用普通字符替代转义字符,则应该尽量选择普通字符。
量词
主要目的是匹配不确定的字符位数,常见的语法有:
* 匹配至少0位
+ 匹配至少1位
? 匹配至少0位到1位
上面这些量词符号,其实是{}语法的一种简写形式,即:*对应{0,},+对应{1,},?对应{0,1}。{}是专门进行量词匹配的。
例:
let str = 'ab';
let reg = /ab+/.test(str); // 匹配 ab abb abbb ...
let str2 = '1234';
let reg2 = /\d{4}/.test(str2); // 匹配四位数字
字符范围
有时候需要对字符进行或的操作,在正则中专门提供了 | 作为或操作方式。
let str = 'abc';
let reg = /a(b|d|e)c/.test(str); // 匹配:abc、adc、aec 这几个词
除了可以用 | 操作符以外,还可以选择 [] 方式。
let str = 'abc';
let reg = /a[bde]c/.test(str); // 匹配:abc、adc、aec 这几个词[ ] 中的每一个字符都是或的关系,如果要表示返回比较大的操作,还可以采用-语法。
let str2 = 'abc';
let reg2 = /a[a-z]c/.test(str2); // a-z匹配26个字母 0-9匹配所有数字等[] 中还可以进行排除操作,通过^语法实现。
let str3 = 'abc';
let reg3 = /a[^bde]c/.test(str3); // 匹配除了:abc、adc、aec 这几个词以外的词
起始与结束
有时候需要匹配整体字符串,而不是只匹配字符串的部分,这种情况下就要用到起始和结束了,例如只匹配两位数的正则写法。
let str = 'a19b';
let reg = /^\d{2}$/.test(str); // false 需要整体匹配成功才可
let reg2 = /\d{2}/.test(str); // true 部分匹配成功即可
其中^表示起始位置必须是数字,$表示结束位置必须是数字,这样就可以保证正则去字符串中匹配整体。