正则表达式

第1章认识正则

所谓正则，其实就是字符串规则表达式，比如说大家熟悉的"*"代表的是所有字符.其实不应该叫正则表达式，你叫它规则表达式更好，因为它的主要作用就是，通过规则，找出你想要找的东西。

1.描述你要找的字符串的规律。
2.调用函数，执行该正则表达式。

1.php

//把字符串的'hi'找出来
//规律:'hi'
$str = 'hi，this is his history';
$patt = '/hi/';
preg_match_all($patt，$str，$res);
print_r($res);

程序员都会用到，但是平常用的不多，所以容易忘。

入手:找谁？怎么找？找几个？

具体字符(字面值) --> 比如说就找a，b，hi
字符边界(下面加粗) --> 从哪开始到哪结束
字符集合[ace]，[0123456789] --> 里面任意条件符合找出来
字符补集[^ qxz]:不在qxz范围内 --> 里面任意条件符合的不要
字符范围[a-z0-9] --> 注意:必须是连续的，你不能写a-Z
字符簇(系统定义好的常用集合，在第二章) --> 系统定义好的常用集合

字符边界

^ 匹配字符串的开始
$ 匹配字符串的结尾
\b 匹配单词的开始和结尾(边界)
\B 匹配单词的非边界

第2章常用字符簇

簇	代表
.(点)	任意字符，不含换行
\w	[a-zA-Z0-9 _]
\W	\W的补集
\s	空白符，包括\n\r\t\v等
\S	非空白符
\d	[0-9]
\D	非数字

第3章单词匹配

// 把字符串的hi单词找出来
// 规律，单词开始处=>hi=>单词结束处 \b
$str = 'hi ， this is some history book';
$patt = '/\bhi\b/';
preg_match_all($patt，$str，$res);
print_r($res);

//把包括在单词内部的hi找出来
$patt = '/\Bhi\B/';
$str = ''

第4章集合与补集示例

/*
给定一组手机号，必须由[0123456789]组成的，才选出来从哪找?从字符串的开始找，找到字符串的结束 ^ $ 
找谁[01235689]
找几个?11个
*/
$arr = array('13800138000'，'13487656887'，'434456'，'45454353434543');
//$patt = '/^[^47]{11}$/'; //补集方法
$patt = '/^[01235689]{11}$/';//集合方式
foreach($arr as $v){
    preg_match_all($patt，$v，$res);
    print_r($res);
}

第5章字符范围

//试着找纯字母组成的单词
$str = 'o2o， b2b，hello，wordl， that';
//$patt = '/\[a-zA-Z]{1，}\b'; //{1，}最少1个字母
$patt = '/\b[a-zA-Z]+\b';
preg_match_all($patt，$str，$res);
print_r($res);

第6章字符簇

就是系统规定好的标识方法

$str = 'tommorw is another day，o2o ，you dont bird me i dont bird you';
$patt = '/\W{1，}';// \w \w[a-zA-Z0-9_]的补集
//preg_split 通过正则的表达式，分割字符串
print_r(preg_split($patt，$str));

//把多个空格或者制表符换成一个空格
$str = 'a     b     hello         world';//'a b hello world';
$patt = '/\s{1，}/'; //\s空白符，包括 \n\r\t\v 等
//preg_replace - 执行一个正则表达式的搜索和替换
echo preg_replace($patt，' '，$str);

第7章找几个

*匹配前面的子表达式零次或多次。
+匹配前面的子表达式一次或多次。
? 匹配前面的子表达式零次或一次。
{n} n是一个非负整数。匹配确定的 n 次。
{n，m} m和 n均为非负整数，其中n <= m
最少匹配 n 次且最多匹配 m 次。。
{n，} n 是一个非负整数。至少匹配n 次。

$str = 'longren lao wang meng ge bi ';
// 5个字母组成的单词
//$patt = '/\b[a-zA-Z]{5}\b/';

// 3-5个字母组成的单词
//$patt = '/\b[a-zA-Z]{3，5}\b/';

// 5个以上字母组成的单词
//$patt = '/\b[a-zA-Z]{5，}\b/';

preg_match_all($patt， $str， $res);
print_r($res);
/*
某编辑部，键盘坏了，0键弹不出来，经常打出多个0
于是god打成good，gooood，请把这些单词替换成god
*/
$s = 'goooood，goood，goooooooooood';
$p = '/go+d/';
print_r(preg_replace($p，'god'，$s));

第8章或者的用法

//查询纯数字或者纯字母的词
$str = 'hello o2o 2b9 250';
$patt = '/\b[a-zA-Z]+\b|\b[0-9]+\b/';//最少一个
preg_match_all($patt，$str，$res);
print_r($res);

//查询苹果系统的产品
$str = 'ipad，iphone，imac，ipod，iamsorry';
$patt = '/\bi(pad|phone|mac|pod)\b/';
preg_match_all($patt，$str，$res);
print_r($res);

第9章贪婪与非贪婪

$str = 'ksda good goooood good kl s ja dfs dk ';
//把g(任意多的内容)d 这样的字符串，换成god
$patt = '/g.+d/'; //默认贪婪模式(会尽量多匹配)
preg_match_all($patt，$str，$res);
print_r($res); //god is not good

$patt = '/g.+?d/'; //在数量(+ * {n，})限定符后，加?，非贪婪模式
preg_match_all($patt，$str，$res);
print_r($res); //god，good

第10章采集手机号

$str = '汤小姐，联系手机号:18611015252，备用电话:18828821111，QQ:381413622，email:381413622@qq.com，，身份证号:430426199901013478';\
//采集电话号码\
$patt = '/\b1[358]\d{9}\b/';\
preg_match_all($patt，$str，$res);\
print_r($res);

第11章后向引用

找收尾字母相同的单词

$str = 'txt hello，high，bom，mum';
//简化，先找到首尾字母都是t的
$patt = '/\bt\w+t\b/';
preg_match_all($patt，$str，$res);
print_r($res);

此方法重复26次，也能找到

//第n个小括号内的子表达式，命中的内容，后面就用\n来引用
//后向引用
$patt = '/\b([a-z])\w+\1\b/';
//1.单词开始和结束 \b\b
//2.开始的[a-z]都可以.\b[a-z]\b
//3.后面跟什么都行，不管.并且字数不限 \b[a-z]\w+\b
//4.最后一个应该和第一个相同.\b([a-z])\w+\b 子表达式，放在下面另一个数组里面，最后一个引用子表达式匹配出来的结果\b([a-z])\w+\1\b
preg_match_all($patt，$str，$res);
print_r($res);

把手机号中间的4位替换为*

$str = '13800138000 ， 13426060134 ';
//前3位和后4位放子表达式中，中间4位随便，保留子表达式.替换中间的4位
$patt = '/(\d{3})\d{4}(\d{4})/';
//preg_match_all($patt， $str， $res);
//print_r($res);
echo preg_replace($patt， '\1****\2'， $str);

第12章模式

模式修饰符，可以一定程度上影响正则的解析行为
比如i，就代表正则不区分大小写， /[a-z A-Z ]+/ --->/[a-z ]+/i
比如s，单行模式，就代表把整个文件看成一个"单行"，忽略回车

$str = 'hello WORLD  ChINa';
//$patt = '/\b[a-z]+\b/'; //hello
$patt = '/\b[a-z]+\b/i'; // 忽略大小写
preg_match_all($patt， $str， $matches);
print_r($matches);


$str = "abc haha
abc dgh";
$patt = '/.+/s'; # single 单行模式，将所有内容看成一整行
preg_match_all($patt， $str， $matches);
print_r($matches);

//U 模式，把传入的参数看成unicode字符集的编码，可以判断中文
// http://blog.sina.com.cn/s/blog_640937d101017pca.html
// PHP下正则匹配中文，u模式，\x{4e00}-\x{9fa5}

$str = 'bob李';
$patt = '/^[\x{4e00}-\x{9fa5}]+$/u';
echo preg_match($patt，$str)?'国货':'杂货';

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

正则表达式

第1章 认识正则

第2章 常用字符簇

第3章 单词匹配

第4章 集合与补集示例

第5章 字符范围

第6章 字符簇

第7章 找几个

第8章 或者的用法

第9章 贪婪与非贪婪

第10章 采集手机号

第11章 后向引用

第12章 模式

推荐阅读更多精彩内容