一、字符串基础
1. 什么是字符串(str)
1)字符串
字符串是容器型数据类型(序列)
以单引号或者双引号作为容器的标志,引号中所有的内容都属于字符串的元素
'abc' -> 元素分别是'a
', 'b
', 'c
'
''a,b,c' -> 元素分别是'a
', ',
', 'b
', ',
', 'c
'
'特点:不可变,有序(支持下标操作)
2)字符串的元素
字符串中元素又叫字符
注意:
python中有字符的概念,但是没有字符类型;长度是1的字符串就可以看作字符
a. 普通字符:字母、数字、各国文字和符号等(可以直接写在引号中的符号)
'abc', 'abc123', '+-%abc字符串'
b. 转义字符:字符串中在一些特殊的符号前加\来表示特殊的功能和意义
\'
----- '
\"
----- "
\n
----- 换行符
\\
----- \
\t
-----制表符
str1 = 'abc\'123'
print(str1) # abc'123
str2 = 'abc\n123'
# abc
# 123
print(str2)
str3 = 'abc\\n123'
print(str3) # abc\n123
str4 = 'abc\t123'
print(str4) # abc 123
str3 = '\tabc\\n123'
str4 = ' abc\\n123'
print(len(str3), len(str4)) # 9 12
c.编码字符:\u4位18进制数 - 将4位16进制数对应的编码值转换成字符
1)字符编码
计算机只有直接存储数字的能力,不能直接存储字符
当需要使用计算机存储字符时,实质存储的是字符对应的固定数字,即字符编码
每一个字符和数字的对应关系,称为编码表
2)ASCII码表和Unicode编码表
ASCII码表是由美国国家标准制定的专门针对美国符号进行编码的
里面只包含一些特殊符号、字母和数字(不包含中文、日语、韩语等)
python采用的是Unicode编码表,Unicode编码表是对ASCII码表的扩展,包含了所有国家所有语言的符号(又叫万国码)
中文范围:0x4E00 ~ 0x9FA5
3)字符编码相关的方法
chr(编码值) - 将编码值转换成字符
ord(字符) - 获取字符对应的编码值
str5 = '\u4e00'
print(str5) # 一
print(chr(ord('a') + 25)) # z
二、字符串操作
1. 获取字符
1)获取单个字符 - 与列表获取元素相同
str1 = 'hello world!'
print(str1[0]) # 'h'
print(str1[-2]) # 'd'
2)字符串切片
str1 = 'hello world!'
print(str1[2:6:2]) # 'lo'
print(str1[2:6:-2]) # '' - 空串
print(str1[3:]) # 'lo world!'
print(str1[3::-1]) # 'lleh'
3)遍历
# a
# b
# c
for char in 'abc':
print(char)
2. 字符串操作
1)+ 和 *
字符串1 + 字符串2 :将字符串1和字符串2拼接在一起,产生一个新的字符串
字符串 * N / N * 字符串:字符串重复N次产生一个新的字符串
str1 = 'abc'
str2 = '123'
print(str1 + str2) # abc123
print(str1 + ':' + str2) # abc:123
print(str1 * 3) # abcabcabc
2)==, !=
print('abc' == 'abc') # True
print('abc' == 'acb') # False
3)>, <, >=, <=
只能两个字符串比较大小
从前往后找到第一组不相等的字符,比较它们编码值的大小,编码值大的字符串也大
'0' <= char <= '9':判断是否是数字
'a' <= char <= 'z':判断是否是小写字母
'A' <= char <= 'Z':判断是否是大小字母
'a' <= char <= 'z' or 'A' <= char <= 'Z':判断是否是字母
'\u4e00' <= char <= '\u9fa5':判断是否是中文
print('abc' > 'bc') # False
print('abcf' > 'abca') # True
print('abcef' > 'aeaaa') # False
4)in/ not in
字符串1 in 字符串2:判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
str3 = 'how are you!'
print('how' in str3) # True
print('h' in str3) # True
print('ha' in str3) # False
5)len, max, min, sorted, str
注意:
转义字符和编码字符的长度都是1
字符串转换:所有的数据类型都可以转换为字符串,转换是将数据放在引号中
str3 = 'how are you!'
print(len(str3)) # 12
str3 = '\\how are\tyou!'
print(len(str3)) # 13
str3 = '\u4effhow are\tyou!'
print(len(str3)) # 13
str3 = 'how are you!'
print(max(str3)) # y
# [' ', ' ', '!', 'a', 'e', 'h', 'o', 'o', 'r', 'u', 'w', 'y']
print(sorted(str3))
print(str([1, 2, 3])) # '[1, 2, 3]'
6)r语法
在字符串的最前面加r或R可以阻止字符串中所有的转义字符转义
str1 = '\thow\nare\'you!\u4e00'
# how
# are'you!一 14
print(str1, len(str1))
str1 = r'\thow\nare\'you!\u4e00'
print(str1, len(str1)) # \thow\nare\'you!\u4e00 22
7)格式字符串
在字符串中用格式占位符表示字符串中不确定的部分
a. 语法:包含格式占位符的字符 % (数据1, 数据2, ...)
注意:
括号中数据的个数和类型要和前面的格式占位符一一对应
b. 格式占位符
%s:字符串
%d:整数
%.Nf:浮点数,N控制小数点后小数的位数
%c:字符(可以将数字转换成字符)
注意:
所有的数据都可以使用%s来作为格式占位符,所有的数据都可以使用%s来接收
name = input('请输入姓名:')
age = int(input('请输入年龄:'))
gender = input('请输入性别:')
# xx 今年xx岁,性别:x!
message = '%s今年%d岁,性别:%s!' % (name, age, gender)
print(message)
str4 = 'a: %s, b: %d, c: %f, d: %.2f, e: %c' % ('HOW', 100, 1.23456, 1.23456, 'A')
print(str4) # a: HOW, b: 100, c: 1.234560, d: 1.23, e: A
str4 = 'a: %s, b: %d, c: %f, d: %.2f, e: %c' % ('HOW', 100, 1.23456, 1.23456, 97)
print(str4) # a: HOW, b: 100, c: 1.234560, d: 1.23, e: a
str4 = 'a: %s, b: %s, c: %s, d: %s, e: %s' % ('HOW', 100, 1.23456, 1.23456, 97)
print(str4) # a: HOW, b: 100, c: 1.23456, d: 1.23456, e: 97
8)format
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。
基本语法是通过 {} 和 : 来代替以前的 % 。
format 函数可以接受不限个参数,位置可以不按顺序。
"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序
'hello world'
"{0} {1}".format("hello", "world") # 设置指定位置
'hello world'
"{1} {0} {1}".format("hello", "world") # 设置指定位置
'world hello world'
三、字符串相关方法
1. 字符串对齐方式
字符串.center(宽度, 填充字符=' '):居中
字符串.ljust(宽度, 填充字符=' '):左对齐
字符串.rjust(宽度, 填充字符=' '):右对齐
字符串.zfill(宽度) == 字符串.rjust(宽度, '0') 左填充零
str1 = 'abc'
# 居中
print(str1.center(9, '+')) # +++abc+++
# 左对齐
print(str1.ljust(9, '+')) # abc++++++
# 右对齐
print(str1.rjust(9, '+')) # ++++++abc
# 左填充零
print(str1.zfill(9)) # 000000abc
num = 12
print(str(num).zfill(3)) # 012
num = 9
print(str(num).zfill(3)) # 009
2. 统计子串的个数
字符串1.count(字符串2):统计字符串1中字符串2的个数
str1 = 'how are you! Im fine, thank you! And you?'
print(str1.count('you')) # 3
print(str1.count('h')) # 2
# 在下标是[0, 12)中统计字符串'you'的个数
print(str1.count('you', 0, 12)) # 1
3. 获取子串下标
print(str1.find('you')) # 8
print(str1.index('you')) # 8
print(str1.find('you1')) # -1
print(str1.index('you1')) # ValueError: substring not found
4. join方法
字符串.join(序列):将序列中的元素用字符串连接产生一个新的字符串
要求序列中的元素必须是字符串,如果是字典key必须是字符串
new_str1 = '+'.join('123')
print(new_str1) # 1+2+3
new_str1 = ''.join(['小明', '小花', '小红'])
print(new_str1) # 小明小花小红
# TypeError: sequence item 0: expected str instance, int found
new_str1 = '+'.join([1, 2, 3])
5. 替换
字符串1.replace(字符串2, 字符串3)
将字符串1中所有的字符串2都替换成字符串3
字符串1.replace(字符串2, 字符串3, N)
将字符串1中前N个字符串2替换成字符串3
str1 = 'How are you! Im fine, thank you! And you?'
new_str1 = str1.replace('you', 'YOU')
print(new_str1) # How are YOU! Im fine, thank YOU! And YOU?
new_str1 = str1.replace('you', 'me', 2)
print(new_str1) # How are me! Im fine, thank me! And you?
6. 字符串切割
字符串1.split(字符串2):将字符串2作为切割点切割字符串1,返回一个列表
str1 = 'How are you! Im fine, thank you! And you?'
str_list = str1.split(' ')
print(str_list) # ['How', 'are', 'you!', 'Im', 'fine,', 'thank', 'you!', 'And', 'you?']
str_list = str1.split('!')
print(str_list) # ['How are you', ' Im fine, thank you', ' And you?']