一起学习正则表达式(一)那些让人头晕的元字符

本篇文章已授权微信公众号 guolin_blog (郭霖)独家发布

转载请注明出处:https://www.jianshu.com/p/323c6f3afa62

本文出自 容华谢后的博客

往期回顾:

《一起学习正则表达式(一)那些让人头晕的元字符》

《一起学习正则表达式(二)量词与贪婪》

《一起学习正则表达式(三)分组与引用》

《一起学习正则表达式(四)常见的4种匹配模式》

《一起学习正则表达式(五)断言匹配》

《一起学习正则表达式(六)正则匹配原理》

《一起学习正则表达式(七)回溯陷阱》

0.写在前面

在开发中,正则表达式常用于邮箱、手机号的校验,文本的批量查找、替换等操作。

大部分同学,在拿到需求的时候,第一件事一定是打开浏览器,搜索:邮箱 正则表达式 怎么写,然后Ctrl C + V,测试几个条件没问题,就提交了,出了问题也不知道怎么修改,只能再求救热心网友。

本篇文章,主要带大家了解一下,正则表达式的基本用法,有个初步的了解,看到正则后不再一脸懵。

比如IPv4地址的正则表达式:

^([1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.(0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

如果你没看过本篇文章,第一眼看到这个表达式一定有点头晕,乱七八糟写的是啥,别担心,学完后你就会发现,那些看似复杂的表达式,其实也不过如此。

本篇文章主要内容的思维导图,后续可用于快速查询:

思维导图

1.特殊单字符

在正则表达式中,普通字符表示的还是原来的意思,比如表达式 1 可以匹配到数字 1,表达式 a 可以匹配到字母 a

但是如果想要匹配到更多字符的时候,我们不可能把所有的字符都列一遍,这样就太浪费时间了,那有什么更好的办法呢,接下来就是元字符大显身手的时间了。

. 点号通配符,可以匹配到除换行外的任意字符:

点号通配符

\d 数字通配符,可以匹配到数字0-9

\D 如果将D大写,则匹配到的是任意非数字,相当于 \d 的反义

数字通配符

\w 字母数字下划线通配符,可以匹配到任意的字母数字下划线

\W 如果将W大写,则匹配到的是任意非字母数字下划线

字母数字下划线通配符

\s 空白符通配符,可以配到任意空白符,包括回车、换行、换页、制表符等

\S 如果将S大写,则匹配到的是任意非空白符

空白符通配符

到这里,特殊单字符就讲完了,汇总下:

特殊单字符

2.空白符

空白符分为下图中的几类,一般我们用 \s 表示就可以了:

空白符

3.范围

  • | 或,和你心中想的那个或是一样的,ab|bc 可以匹配到ab或者bc

  • [...] 多选一,比如 [abc] 可以匹配到字母a,也可以匹配到字母b或c

  • [a-z] 匹配a到z之间的任意元素,\w 这个通配符就可以用 【a-zA-Z0-9_】 来表示

  • [^...] 取反,不能是括号内的任意单个元素

注意:以上的表达式每次只能匹配到单个元素

范围

4.量词

  • * 星号,代表出现0到多次,可以出现,也可以不出现,出现的话,不限制次数

  • + 加号,代表出现1到多次,也就是至少出现一次的意思

  • ? 问号,代表出现0到1次,比如Http协议的正则就可以用 Https? 表示

  • {m} 代表出现m次,比如 a{1} 就表示匹配的规则中,字母a只能出现1次

  • {m,} 代表至少出现m次,{0,} 相当于星号,{1,} 相当于加号

  • {m,n} 代表出现m到n次,{0,1} 相当于问号

量词

5.实战

现在我们再回过头来,看下文章开头的正则表达式:

^([1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.(0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

是不是觉得有点思路了,下面我们一起来实现下,先讲讲规则:

  • IPv4地址的范围,我们定义为 1.0.0.0 - 255.255.255.255,当然专业上肯定有更严格的定义划分,我们此处不纠结

  • 通过以上范围,我们可以得出基本规则 [1-255].[0-255].[0-255].[0-255]

  • 可以看出后三位是重复的 .[0-255],所以我们只需要先写出 [0-255] 的规则,后面就很简单了

  • ^$ 用于标识行的开始和结束,这个我们下一篇文章会讲到

开始吧:

1.如何表达一个两位数字的范围

通过上面的学习,我们知道一个数字可以用 \d[0-9] 来表示,如果要表达多位数呢,比如0-99。

可以这样拆分,0-99的范围,最少的位数是1位,最多的位数是2位,那我们可以用2个数字通配符来表示,为了清晰和美观,我们此处用 [0-9]表示。

写起来就是:

0|[1-9][0-9]?

其中,0 代表数字0,因为要排除 00 的情况,所以不能使用 [0-9][0-9]? 来表示,中间有个或 |,后面的 [1-9][0-9]? 表示1-99,还记得 ? 的含义吗,代表出现0到1次。

2.如何表达一个三位数字的范围

两位的写完了,三位的就很简单了,我们来写下0-255的范围。

这里要注意下:

  • 当数字达到3位的时候,百位只能是1或2

  • 当百位数字是2的时候,十位数字只能是0-5

  • 当十位数字是5的时候,个位数字只能是0-5

来写一下:

0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5]

0-255到范围写完了,去掉0就成了1-255的范围:

[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5]

3.组合

最后组合下,还记得 {3} 的含义吗,代表这个字符或组合出现3次:

注意:. 点号别忘了用 \ 转义下

^([1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.(0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

大功告成,有没有豁然开朗的感觉,验证下:

IPv4

6.写在最后

到这里,正则表达式的基本用法就讲完了,如果有问题可以给我留言评论,谢谢。

正则表达式在线校验工具:https://regex101.com/

下一篇文章,我们来一起学习下正则的断言机制,敬请期待!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容