正则表达式是一个用于操作字符串的很强大的工具,应用广泛,具有很高的价值。像我们很常见的表单校验功能,数据爬虫等都能用上。
分类
正则表达式中概念性的东西多而杂,不易于记忆和学习。为了易于学习,这几天我简单的给正则里的概念分类和整理了一下,这里记录一下。
方法
js中正则表达式对象的方法比较少,有3个
- compile() 编译正则表达式
- test() 检测字符串是否符合特定规则,返回true或者false
- exec() 检索字符串中指定的值。返回找到的值,并确定其位置。
结构
结构涉及到的东西比较少,像双斜杠(//),表示定义正则表达式,你的正则表达式句子需要写在双斜杠中间;开头匹配符(^);结尾匹配符($)
// 像 /ab/ 可以匹配到包含ab的字符串
var str1 = 'hhhh你好啊ab再见222';
var str2 = 'hhhhaaaab222';
var str3 = 'hhhhhahhh2b';
var reg = /ab/ ;
console.log(reg.test(str1)); // 结果为true
console.log(reg.test(str2)); // 结果为true
console.log(reg.test(str3)); // 结果为false
上面的结果都很好理解,一眼就看出来了,那么加上开头匹配符和结尾匹配符呢?
例如像 /^abc$/ 匹配 'ab2efeafc' 和 'abc' 的结果。
var reg = /^abc$/
var str1 = 'ab2efeafc';
var str2 = 'abc';
console.log(reg.test(str1)); // false
console.log(reg.test(str2)); // true
到这里也很好理解,但需要注意的是: 无论是^也好,还是$,还是之后的限定符,它们的作用范围都是临近的1个表达式或者字符的。
限定符
限定符,意思就是前面的规则重复几遍。在这里需要注意的是,限定符的只能作用于它前面的1个字符或者1个表达式。
例如: /ab{2}/ 这里到底是匹配 'abab' 还是 'abb' ?
var reg = /ab{2}/;
var str1 = 'abab';
var str2 = 'abb';
console.log(reg.test(str1)); // false
console.log(reg.test(str2)); // true
限定符有以下几种形式
- (?) 号,表示匹配前面的字符或表达式重复0次或者1次
- (*) 号,表示匹配前面的字符或表达式重复0次或者多次
- (+) 号,表示匹配前面的字符或表达式至少重复1次
- ({n,m}),表示匹配前面的字符或表达式重复n-m次,若是n>m则会报错。
- ({n}),表示匹配前面的字符或者表达式n次。
var reg = /ab?c/;
var str1 = 'abcab';
var str2 = 'abbc';
var str3 = 'accb'
console.log(reg.test(str1)); // true
console.log(reg.test(str2)); // false
console.log(reg.test(str3)); // true
区域符
所谓区域符,是指仅仅想匹配某一些指定的字符串。这里区域符有2个,[]和()。
区域符很简单,比如想匹配 abc中的一个,用[abc],想匹配小写a-z中的一个,用[a-z],想匹配大写字母中的一个用[A-Z],相匹配数字可以这样写[0-9]
又比如匹配 . * ? + \等特殊字符,可以用[\.\*\?\+\\]这样。
元字符
元字符,即拥有特殊含义的字符。比如匹配数字,可以用\d,匹配非数字用\D;匹配换行符用\n等。具体如下
- (.) 号,匹配单个字符,除了换行和行结束符。
- \d ,匹配数字。
- \D ,匹配非数字。
- \w ,匹配单词。
- \W ,匹配非单词。
- \s ,匹配空白符。
- \n ,匹配换行符。
- \f ,匹配换页符。
- \r ,匹配回车符。
- \t ,匹配制表符。
- \v ,匹配垂直符。
比如js中,去除字符串中的所有空格可以这样写,var newStr = oldStr.replace(/\s/g,"");
想匹配数字可以用\d ,和[0-9]是等效的。
// 例如简单匹配手机号可以这样写,12号段目前是没有的
var reg = /^1[3456789]\d{9}$/;
var phone1 = '12890908931'
var phone2 = '13078765638'
var phone3 = '130909028931' // 12个字符
var phone4 = '1879089789' // 10个字符
var phone5 = '14909038x9' // 中间有非数字
console.log(reg.test(phone1)); // false
console.log(reg.test(phone2)); // true
console.log(reg.test(phone3)); // false
console.log(reg.test(phone4)); // false
console.log(reg.test(phone5)); // false
转义字符
在正则中,有些字符有特殊作用,像? + . / \ 等,如果想匹配这些字符呢?那就用反斜杠()转义一下。
例如: \+ \. \\ \/等。
总结
学会上面那些,就算是正则入门啦,以后简单的规则校验也难不倒了,就算是稍微复杂点的正则也能看懂了。