Sequences(序列)
Python的序列类型具有以下特点:成员元素有序排列,个数有限,可重复 。序列包括: 字符串,列表 和 元组。
不可变序列:
不可变序列类型的对象在创建后不能更改,如果你试图去修改一个不可变对象Python将会报错。如果对象包含对其他对象的引用,这些引用不能改变,但是其他对象本身可以是可变的并且可以改变。例如:元组 a = (1, [2, 3, 4], 5),中a[1]是一一个对[2, 3, 4]列表的引用,a[1]这个引用不可以改变,只能指向[2, 3, 4],但是[2, 3, 4]这个列表本身是可以改变的。字符串和元组是不可变序列。
可变序列:
可变序列在创建后可以更改,下标和切片表示法可以用于赋值和del(delete)语句的目标。列表是可变序列。
一、字符串(String)
Python 中的字符串为引号之间的字符序列集合,Python 没有字符类型。
Python 支持使用成对的单引号或双引号来创建字符串,他们作用是相同的。之所以这两种形式都可以使用,是因为你可以不使用反斜杠转义字符就可以实现在一个字符串中包含其余种类的引号。并且Python倾向于打印所有这些形式的字符串为单引号,除非字符串内有了单引号了。Python自动的在任意的表达式中合并相邻的字符串常量(中间没有任何操作符),尽管可以简单地在它们之间使用 +
操作符来明确的表示这是一个合并操作。在这些字符串之间增加逗号会创建一个元组,而不是一个字符串。
使用索引运算符 [ ]
和切片运算符 [ : ]
可以得到子字符串。
在大部分应用程序里,没有必要显式的删除字符串。定义这个字符串的代码最终会结束,那时 Python 会自动释放这些字符串。
1、用转义序列代表特殊字符
在Python中使用反斜杠符号( \ )来引入特殊的字节编码(比如 \n 代表着换行符),这就是转义序列。转义序列让我们能够在字符串中嵌入不容易通过键盘输入或者已作为字符串相关操作符(例如:' ,",\ 符号要在字符串中标识自身需要在前面加上\符号,例如:',",\)的字符。字符串常量中字符 “\”,以及它后面的一个或多个字符,在最终的字符串对象中会被一个单个字符所替代,这个字符通过转义序列定义了一个对应的二进制值。其中字符 \n 表示一个换行符, \t 表示一个制表符。这个字符串打印时的格式取决于打印的方式。交互模式下(调用repr()函数)是以转义字符的形式回显的,但是print()函数(调用str()函数)会将其解释出来。
Python的转义字符:
在Python中并不会像C语言那样使用一个0(空)字符去结束一个字符串,Python没有字符会结束一个字符串,Python在内存中保存了真个字符串的长度和文本。
虽然这样可以在字符串中编写反斜杠常量字符,但是你需要将上述表中的内容都记住。所以我们更建议使用重复的两个反斜杠或者raw字符串,来在字符串中表示反斜杠字符。
2、使用raw字符串抑制转义
使用转义序列来处理嵌入到字符串中的特殊字符是很合适的,但是有时候这种方式也会比较麻烦。有时候新手会使用这样的文件名参数去尝试打开一个文件。问题是这里有“\U” 和 “\n”,他们会识别为转义字符。当然我们可以使用两个反斜杠字符来在字符串中包留反斜杠,但是我们有更方便的方法。
种情况下使用 raw 字符串就会很方便。如果字符 r
或者 R
出现在字符串的第一个引号的前面,它将会关闭转义机制。所以在 raw 字符串中 Python 会将反斜杠作为常量字符来保持,而不会匹配后面跟着的字符作为转义序列。
Python脚本会自动的在Windows和Linux的路径中使用斜杠 /
表示文件路径,因为Python是按照可移植的方法来解释路径。所以myfile = open(r"C:/User/new/test.txt", "w") 也是有效的。
注意:一个raw字符串不能以单个反斜杠结尾,因为反斜杠会转义后面的引号。总结来说一个raw字符串不能以奇数个反斜杠结尾。
3、使用三重引号编写多行字符串块
使用三引号可以允许一个字符串跨多行书写,我们有时候称其为块字符串。这个形式以三重引号开始(单引号和双引号都可以),并紧跟任意行数的文本,并且以和开始时同样的三重引号结尾。Python把所有在三重引号之内的文本收集到一个字符串中,并在代码换行处嵌入了换行符。这种方式在程序中需要输入多行文本的任何时候都是很有用的。
三重引号字符串常用于文档字符串,当它出现在文件的特定地点时,会被当作注释一样的字符串常量。我们也经常在开发的过程中使用三重引号来废除一些代码。
4、字符串格式化
字符串格式化允许在一个单个的步骤中对一个字符串执行多个特定类型的替换。字符串的格式化可以使用字符串格式化表达式的形式,或者调用字符串的 format()
方法。
(1)表达式形式
Python在对字符串操作的时候自定义了 %
操作符,它提供了简单的方法对字符串的值进行格式化。
格式化字符串:
- 在
%
操作符的左侧放置一个需要进行格式化的字符串,这个字符串带有一个或多个嵌入的转换目标(%s
%d
等),都已%
开头。 - 在
%
操作符的右侧放置一个(或多个嵌入到元祖中的)对象,这些对象将会插入到左侧想让Python进行格式化字符串的一个(或多个)转换目标的位置上去。
转换目标格式:
% [(name)] [flags] [width] [.precision] typecode
参数说明:
- name : 可选,用于选择指定的key
-
flags:可选,用于表示对其方式,通常和 width 一起使用,无居中功能
(+:右对齐 -:左对齐 空格:右对齐 。。。) - width:可选,指定占位宽度
- precision : 有用,小数点后保留的位数
-
typecode : 必选,
- %s : 字符串
- %r:同%s,但是用repr,而不是str
- %c:字符
- %i:整数
- %u:无号(整数)
- %%:常量%
- %d:十进制
- %o:八进制
- %x: 十六进制
由于对象的每个类型都可以转换成字符串(打印时所使用的),每一个与 %s 转换目标一同参与的对象类型都可以转换代码。正因为如此,除非你要做特殊的格式化,一般你只需要记得用 %s 这个代码来格式化表达式就可以了。
格式化总是返回新的字符串作为结果而不是对左侧的字符串进行修改(由于字符串是不可变对象)。(2)format()方法
字符串对象的 format()
方法使用主体字符串作为模板,并且接受任意多个表示要根据模板替换的值的参数。在主体字符串中,花括号通过位置(例如:{1})或关键字(例如:{food})指出替换目标及要插入的参数,因为Python的函数和方法的参数可以使用位置或关键字名称来传递。
就像 % 表达式和其他字符串方法一样,format() 创建并返回一个新的字符串对象(因为字符串是不可变对象类型,所以 format() 函数必须创建一个新对象)。
格式化字符串:
对于格式化方法,我们在替换目标的标识之后使用一个冒号,后面跟着可以指定字段大小,对齐方式和一个特定类型编码的格式化声明。
转换目标格式:
{ fieldname ! conversionflag : formatspec }
- fieldname:是指定参数的一个数字或关键字,后面跟着可选的 “.name” 或 "[index]" 成分引用。
- conversionflag:可以是r、s、或者a分别是在该值上对repr、str或ascii内置函数的一次调用。
- formatspec:指定了如何表示该值,包括字段宽度、对齐方式、补零、小数点精度等细节,并且以一个可选的数据类型编码结束。
冒号后面的 formatspec
组成形式上的描述如下(方括号表示可选的组成,并且不能编写为常量):
[ [ fill ] align ] [ sign ] [ # ] [ 0 ] [ width ] [ .precision ] [ typecode ]
align
可能是<、>、= 或^,分别表示左对齐、右对齐、一个标记字符后的补充或居中对齐。formatspec
也包含嵌套的、只带有{}的格式化字符串,它从参数列表动态地获取值(和格式化表达式中的*很相似)。
5、常用字符串内建方法
除了一般的序列操作,字符串还有独有的一些操作作为方法存在(对象的函数,将会通过一个调用表达式触发)。尽管序列操作是通用的,但方法不通用(虽然某些类型共享某些方法名,字符串的方法只能用于字符串)。一条简明的法则是这样的:可作用于多种类型的通用类型操作都是以内置函数或表达式的形式出现的(例如:len(x),x[0]),但是类型特定的操作是以方法调用的形式出现的(例如:string.upper())。
注意: 想要查找对象的所有内置方法,你可以调用内置的 dir() 函数,他将返回一个列表,其中包含了对象的所有属性,由于方法是函数属性,他们也会在这个列表中出现。dir() 函数简单的给出了方法的名称。要查询他们是做什么的,可以将其传递给 help() 函数。help() 是一个随Python一起分发的面向系统代码的接口。
注意: 由于字符串是不可变对象,所以字符串的内置方法都不会改变原始的字符串,而是会创建一个新的字符串作为结果返回。
(1)去掉字符串中指定位置的指定字符
string.lstrip([obj]) : 截掉 string 左边的字符(默认为空格)
string.rstrip([obj]) : 删除 string 末尾的字符(默认为空格)
string.strip([obj]) : 在 string 上执行 lstrip()和 rstrip()
(2)按照指定的字符拆分字符串
string.split(str="", num=string.count(str))
以 str 为分隔符切片 string,如果 num有指定值,则仅分隔 num 个子字符串
(3)按照指定的字符把列表元素拼接在一起
string.join(seq) Merges (concatenates)
以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
(4)判断字符串中是否包含某个字符
(5)将字符串的首字母大写
string.capitalize()
(6)使用指定的字符串替换字符串中的指定元素
string.replace(str1, str2,num=string.count(str1))
把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次。
(7)使用指定的符号填充指定大小的指定位置
string.ljust(width,char=' ')
返回一个原字符串左对齐,并使用使用指定的符号填充至长度 width 的新字符串
string.rjust(width,char=' ')
返回一个原字符串右对齐,并使用使用指定的符号填充至长度 width 的新字符串
string.center(width,char=' ')
把字符串放到指定大小的中间位置,并使用指定的符号填充至长度 width 的新字符串
(8)查找字符串中的指定的字符的位置
string.find(str, beg=0, end=len(string))
检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内。如果找到返回开始的索引值,否则返回-1。
string.index(str, beg=0, end=len(string))
跟 find()方法一样,只不过如果 str 不在 string 中会报一个异常.
(9)判断字符串是否为数字
string.isdigit()
如果 string 只包含数字则返回 True 否则返回 False.
(10)判断字符串是否已指定的字符开头或者结尾
string.startswith(obj, beg=0,end=len(string))
检查字符串是否以 obj 开头,是则返回 True,否则返回 False。如果 beg 和 end 指定值,则在指定范围内是否以 obj 开头, 如果是, 返回 True,否则返回 False.
string.endswith(obj, beg=0,end=len(string))
检查字符串是否以 obj 结束,是则返回 True,否则返回 False。如果 beg 和 end 指定值,则在指定范围内是否以 obj 结束, 如果是, 返回 True,否则返回 False.
(11)把字符串转换为大写或者小写或者翻转
string.upper() : 转换 string 中的小写字母为大写
string.lower() : 转换 string 中所有大写字符为小写.
string.swapcase() : 翻转 string 中的大小写
(12)返回 str 在 string 里面出现的次数
***string.count(str, beg=0, end=len(string)) ***
如果 beg 或者 end 指定则返回指定范围内 str 出现的次数。
(13)以指定的格式编码字符串
string.encode(encoding='UTF-8', errors='strict')
以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace'
(14)以指定的编码格式解码字符串
string.decode(encoding='UTF-8', errors='strict')
以 encoding 指定的编码格式解码 string,如果出错默认报一个ValueError 的 异 常 , 除 非 errors 指 定 的 是 'ignore' 或 者'replace'。
(15) 判断字符串中的区分大小写的字符是否全为小写或者大写
string.islower()
如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False。
string.isupper()
如果 string 中包含至少一个区分大小写的字符, 并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False。
(16) 判断字符串中的字符情况
string.isalnum()
如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
string.isalpha()
如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
string.isdecimal()
如果 string 只包含十进制数字则返回 True 否则返回 False.
string.isnumeric()
如果 string 中只包含数字字符,则返回 True,否则返回 False
string.isspace()
如果 string 中只包含空格,则返回 True,否则返回 False.
(17)ASCII码转换 chr() 和 ord()
内建函数ord() 将一个码点从字符串形式转换为范围在0 - 10FFFF之间的一个整数;chr() 将0 - 10FFFF范围之间的一个整数转换为对应的长度为1的字符串对象。《Python基础手册》系列:
Python基础手册 1 —— Python语言介绍
Python基础手册 2 —— Python 环境搭建(Linux)
Python基础手册 3 —— Python解释器
Python基础手册 4 —— 文本结构
Python基础手册 5 —— 标识符和关键字
Python基础手册 6 —— 操作符
Python基础手册 7 —— 内建函数
Python基础手册 8 —— Python对象
Python基础手册 9 —— 数字类型
Python基础手册10 —— 序列(字符串)
Python基础手册11 —— 序列(元组&列表)
Python基础手册12 —— 序列(类型操作)
Python基础手册13 —— 映射(字典)
Python基础手册14 —— 集合
Python基础手册15 —— 解析
Python基础手册16 —— 文件
Python基础手册17 —— 简单语句
Python基础手册18 —— 复合语句(流程控制语句)
Python基础手册19 —— 迭代器
Python基础手册20 —— 生成器
Python基础手册21 —— 函数的定义
Python基础手册22 —— 函数的参数
Python基础手册23 —— 函数的调用
Python基础手册24 —— 函数中变量的作用域
Python基础手册25 —— 装饰器
Python基础手册26 —— 错误 & 异常
Python基础手册27 —— 模块
Python基础手册28 —— 模块的高级概念
Python基础手册29 —— 包