在入门篇中我们介绍过字符串,本节我们更深入地了解字符串。本节将介绍转义字符,原始字符串,以及字符串常用方法等内容。
转义字符
在创建字符串的时候我们既可以用单引号也可以用双引号。当使用双引号创建字符串的时候,我们可以在字符串中使用单引号;当使用单引号创建字符串的时候我们可以在字符串中使用双引号。
>>> line1 = 'tom:"hi"' # 字符串中含有双引号,用单引号创建字符串
>>> print(line1)
tom:"hi"
>>> line2 = "i'm fine." # 字符串中含有单引号,用双引号创建字符串
>>> print(line2)
i'm fine.
可是如果我们要创建的字符串既包括单引号又包括双引号的时候,怎么处理呢?此时我们可以使用转义字符。转义字符包含一个反斜杠\,反斜杠后面是要添加的字符。比如单引号的转义字符是',使用单引号的转义字符我们就能在单引号创建的字符串内也使用单引号了。
>>> line1 = "tom:\"hi\"" # 使用双引号的转移字符
>>> print(line1)
tom:"hi"
>>> line2 = 'i\'m fine.' # 使用单引号的转义字符
>>> print(line2)
i'm fine.
下面给出几个常用的转义字符:
header 1 | header 2 |
---|---|
\' | 单引号 |
\" | 双引号 |
\t | 制表符 |
\n | 换行符 |
\\ | 反斜杠 |
原始字符串
在创建字符串的引号前加上r就使它成为原始字符串。原始字符串的作用是忽略所有的转义字符。这一作用在后面介绍正则表达式的时候非常有用,在这里大家先记住这个概念。
>>> line = r'i\'m fine.'
>>> print(line)
i\'m fine.
字符串和元组
字符串和元组很相似,字符串可以看作是若干字符组成的元组。因此我们可以使用下标取值、切片、for循环、len()、in和not in等。同时需要注意,字符串也是不可变的!也就是说像元组一样,字符串创建之后无法修改。如果尝试修改则会报错TypeError。
>>> line = 'abcd'
>>> line[1] # 通过下标取值
'b'
>>> line[1:] # 切片
'bcd'
>>> 'bc' in line # 使用in判断是否包含子字符串
True
>>> for term in line: # for循环遍历
... print(term)
...
a
b
c
d
>>> line[2] = 'h' # 字符串创建后无法更改,否则会报错
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>>
字符串常用方法
大小写转换&大小写判断
使用upper()和lower()能分别把字符串中的字母转化为大写和小写并返回一个新的字符串。
>>> name = 'Mike'
>>> upper_name = name.upper()
>>> upper_name
'MIKE'
>>> lower_name = name.lower()
>>> lower_name
'mike'
使用isupper()和islower()可以判断字符串中的字母是非为大写或小写。如果字符串中的字母均为大写,则isupper()返回True。如果字符串中的字符均为小写,则islower()返回True。
>>> line1= 'abc'
>>> line1.islower()
True
>>> line1.isupper()
False
>>> line2 = '123AB'
>>> line.isupper() # 字符串中的字母均为大写,因此返回True
True
>>> line3 = '123'
>>> line3.islower() # 字符串中不含字母,因此islower()和isupper()均返回False
False
split()和join()
split()方法我们在入门篇中有过介绍,它的作用是按照自定字符分割字符串,返回一个列表。
>>> line1 = 'abc def ghi'
>>> line1.split() # 不指定分割字符则默认按照空白符分割
['abc', 'def', 'ghi']
>>> line2 = 'abc###def###ghi'
>>> line2.split('###') # 按'###'分割字符串
['abc', 'def', 'ghi']
join()方法与split()方法正好相反,它的作用是使用指定的连接符把一个字符串的列表拼接起来。
>>> names = ['mike', 'jack', 'lucy', 'bob']
>>> '|'.join(names) # 使用'|'拼接字符串列表
'mike|jack|lucy|bob'
startswith()和endswith()
这两个方法在入门篇中也有介绍,分别是判断字符串是否以某字符串开头或结尾。
>>> name = '123Abcd'
>>> name.startswith('123')
True
>>> name.endswith('cd')
True
剔除字符串首尾空白符
strip()能够剔除字符串的首尾空白字符(包括空格符,制表符,换行符)并返回一个新的字符串。lstrip()仅剔除开头的空白字符。rstrip()仅剔除结尾的空白字符。
>>> line = ' abc 123 '
>>> line.strip()
'abc 123'
>>> line.lstrip()
'abc 123 '
>>> line.rstrip()
' abc 123'