正则表达式:符合一定规则的字符串。
正则表达式的组成规则:
A:字符
z字符x,'a'表示字符a.
\\反斜线字符。
\n换行符
\r行首字符
B:字符类
[abc] a,b或c(简单类)
[^abc] 任何字符,除了a,b,c。
[a-zA-Z] a到z 或A到Z,两头的字母包括在内(范围)。
[0-9]0到9的字符都包括在内。
c:预定义字符类
.:任何字符。如果本身就是.,用\.表示,实际中因为\本身表示转义的意思因此常常使用\\.表示一个点。
\d:数字[0-9]。
\w:单词字符:[a-z][A-Z_0-9].
\W:非单词字符:[^\w].
D:边界匹配器
^行的开头
$行的结尾
\b单词边界:就是不是单词字符的地方。
Greedy 数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
注意:
1.数量不专门写的话,默认一次。
2.我们一般写的是字符串,字符串要形成正则表达式还需要进行一步转化。正则有一套规则。
例如:
1.在正则中\d表示数字,然而在字符串中要形成\d却需要这样写"\\d"。
2.在正则中,单纯表示'.',需要写成"\."。然而在字符串中,要表示"\."却需要写成“\\.”。