5.24正则学习
* 18.正则表达式
* 19.RegExp对象
* 20.js中String支持正则的API
正则表达式语法:
1. 最简单正则:关键字正文
2. 备选字符集:字符串中某*一位*上可选的字符的集合
[备选字符列表]
强调:一个备选字符集,只能规定一位字符
如果备选字符列表是(部分)连续的:用-省略中间字符
仅表示*除别字符外*,所有字符均可:^除掉字符——了解
3. 预定义字符集:对常用字符集的简写方式
\d:1位数字 [0-9]
\w: 1位数字,字母或下划线 [0-9a-zA-Z_]
\s: 1位空字符:空格 tab 回车换行
.: 1位任意字符,除回车换行外
预定义字符集 vs 自定义字符集
预定义字符集语法简单,规则是固定的,不可变!
自定义字符集,规则完全自定义,灵活!语法繁琐
4. 数量词:规定一个字符集出现次数的量词
如何使用:紧跟字符集之后,修改相邻的前一个字符集
1. 确定数量:3种:
{m,n} 最少m个,最多n个
{m,} m个以上
{m} 必须m个
2. 不确定数量:3种:
?: 可有可无,最多一个
*: 可有可无,多了不限
+: 至少一个,多了不限
5. 选择和分组:
分组: (子表达式)
选择:或 表达式1|表达式2
手机号:+86或0086 可有可无,最多一个
空字符 可有可无,多了不限
1
3,4,5,7,8 选其一
9位数字,不能多,不能少
(\+86|0086)?\s*1[34578]\d{9}
身份证号:15位数字
2位数字
从数字、x、X中选一个
后两部分整体可有可无,最多一次
\d{15}(\d\d[0-9xX])?
匹配img元素:<img xxxx src="" xxxx />
<img 1位以上任意字符 src= 在'"间选一个 1位以上任意字符 在'"间选一个 1位以上任意字符 />
贪婪模式:默认匹配最长的字符
比如: .* .+
懒惰模式:仅匹配最短的字符
贪婪改懒惰:.*=>(.*?) .+==>(.+?)
<img(.+?)src=['"](.+?)['"](.+?)/>
6. 指定匹配位置:
^:开头位置的xxx,专用在表达式开头
$:结尾位置的xxx,专用在表达式结尾
比如:^\s+ 匹配开始位置的所有空字符
\s+$ 匹配结尾位置的所有空字符
^\s+|\s+$ 匹配开头或结尾的空字符
前加^后加$(不带|):表示从头到尾完整匹配
今后只要验证格式,都要前加^,后加$
比如:验证密码:6位数字:^\d{6}$
\b:单词边界,每个单词前或后,必须有空字符分割——了解
预判:在正式匹配前,使用特定条件先预检查一次字符串
如果预判都未通过,则不再匹配
6位以上字母,数字的组合,至少包含一位大写字母和一位数字
1. 预判:不都由小写字母或数字组成
结论:可能包含大写字母,特殊符号
(?![a-z0-9]+$)
2. 预判:不都由大写字母或小写字母组成
结论:可能包含数字,特殊符号
(?![A-Za-z]+$)
3. 6位以上字母,数字的组合(排除特殊字符)
结论:肯定包含大写字母和数字
[a-zA-Z0-9]{8}
(?![a-z0-9]+$)(?![A-Za-z]+$)[a-zA-Z0-9]{8}
补充:汉字的备选字符集:[\u4e00-\u9fa5]
*/
regexp对象
验证:var bool=reg.test(str)
str符合reg的规则,就返回true,否则返回false
*强调:凡是验证,前加^后加$
var str = "a";
var regExp = /a/;
console.log(regExp.test(str));//true
var str = "a1";
var regExp = /a[0-9]/;
console.log(regExp.test(str));//true
var str = "ac";
var regExp = /a[a-z]/;
console.log(regExp.test(str));//true
var str = "a ";
var regExp = /a\s/;
console.log(regExp.test(str));//true
var regExp = /^\w+@\w+\.\w+(\.\w+)?$/i;
var input = prompt("输入邮箱");
while(!regExp.test(input)){
alert("您输入的邮箱格式不正确请重试");
input = prompt("输入邮箱");
}
alert("验证通过");
js中String支持正则的API
查找:
- 只判断是否包含关键字:不考虑具体内容和个数
var i=str.search(reg);
只能返回第一个找到的关键字的位置
找不到,返回-1 - 获取所有关键字的内容:不考虑位置
var kwords=str.match(reg);
返回所有关键字的内容,保存在kwords数组中
***找不到,返回null,都要先判断不为null,再使用
kwords.length,如果kwords为null,则报错! - 支持正则,即可获得每个敏感词内容,又可获得位置:
var arr=reg.exec(str);
替换或删除子字符串:
var newStr=str.replace(reg,"替换字符");
格式化字符串:
正则表达式中的每个(),都是一个子表达式
每个子表达式都会自动获得一个从1开始的编号
替换时,可用$n,指代本次匹配中第n个子表达式的对应内容
分隔字符串:
var subs=str.split(reg[,count]);
//查找
var str="Visit W3School!";
console.log(str.search(/W3School/)); //6
var str = 'Hello World';
var reg = /o/g;
console.log(str.match(reg));
var str = 'Hello wOrld';
var reg = /o/gi;
var arr=reg.exec(str);
console.log(arr);
console.log('位置'+arr.index); //4
arr = null;
while((arr = reg.exec(str))!=null){
console.log('关键字'+arr[0]+'位置'+arr.index);
} //这里返回的位置是7 说明exec这个方法会自动从匹配字符的下一个位置开始 也就5开始
//替换或删除子字符串
var str ='20170523';
var regExp = /(\d{4})(\d{2})(\d{2})/;
var rs = str.replace(regExp,"$1年$2月$3日");
console.log(rs);
//分隔字符串
var str = "abc1abc23abc";
var arr = str.split(/\d{1,2}/);
console.log(arr.toString());