列表高级操作
列表和列表的内存处理
列表是PYTHON中组合类型中使用较多的类型之一,以其对批量数据提供了有好的访问支持而被广大开发人员所钟爱,在程序开发操作过程中随处可见对于列表的操作。
在开发过程中,我们对于列表的操作有两种不同的情况需要考虑:
1.需要一个存放大量的有规律数据的列表,这个列表怎么定义?
2.列表中存储的数据量过大,会不会对内存产生影响?
列表推导式
现有一个需求,其中要用到一个包含0~10自然整数的列表,应该怎么做?
手工定义:如下面这样的方式
my_list = [0, 1,2,3,4,5,6,7,8,9,10]
但是,如果需要的是0~1000的自然整数的列表呢?
没问题,编码实现
my_list = list()
for i in range(1000):
my_list.append(i)
这样当然没有问题,但是针对存放有规律数据的列表来说,还是稍显复杂了
PYTHON提供了对于有规律数据的快捷操作:推导式,通过推导式可以很快捷方便的生成需要的数据。
# 简单推导式:生成一个包含0~999自然数序列的列表
my_list = [x for x in range(0, 1000)]
# 运算推导式:生成一个包含0~99平方数序列的列表
my_list = [x**2 for x in range(0, 100)]
# 条件推导式:生成一个包含0~100范围内偶数的列表
my_list = [x for x in range(100) if x % 2 == 0]
# 组合推导式:生成一个0~5和0~5二维数据排列相加的和的列表
my_list = [x+y for x in range(0, 5) for y in range(0, 5)]
列表推导式的出现,极大程度的简化了存放有规律数据的列表的操作。
在实际开发过程中,列表推导式的应用相当广泛,甚至可以基本替代一些简单程序结构实现一行代码独立功能流程。
列表生成器
尽管列表简洁方便的可操作性给程序开发带来了非常便捷的操作效率,但是不可忽视的是列表本身存储数据的机制,在进行大量数据处理时,会极度的消耗系统内存,所以列表的操作更多的时候体现在少量数据集中处理的情境下。
但是需求的变化总是不可捉摸,有可能就会遇到我们要操作一个存放上百万数据的列表中的数据,同时这个数据有一定的规律,如我们在某个算法中要重复不断地获取斐波那契数列的下一个数据参与运算,就需要将斐波那契数列的数据临时存储起来方便程序读取,但是该数列的数据基本可以说是无限的,如果将这样的数据通过列表的格式存储在程序中,内存会被大量消耗!
PYTHON针对操作如此频繁的列表,怎么可能视而不见对于内存的大量消耗呢?
列表生成器,就是针对这样的列表使用场景推出的。
生成器语法结构和推到是语法结构极其类似:
# 一个基本生成器,生成0~10自然数序列的数据
my_generator = (x for x in range(0, 10))
# 运行结果:<generator object <genexpr> at 0x103d7e4c0>,这是一个生成器对象
生成器对象必须通过系统内建标准函数next()来获取生成器下一个数据。
生成器的优异性能在于使用时才会运算下一个数据,而不会一次将数据全部加载。
循环遍历与迭代器
在程序中,经常会有这样一些对象,通过for循环可以直接循环迭代
那么这样可以被循环迭代的对象都是什么类型的对象,自定义类型创建的对象是否也可以通过for循环进行迭代操作呢?
PYTHON中提供了一个工具对象:迭代器对象collections.Iterable
该对象的iter()函数可以得到一个可迭代对象:collections.Iterator
程序中通过for循环进行循环遍历操作的,其实就是迭代器对象Iterable
在循环遍历过程中,可迭代对象Iterator是用于索引记录正在遍历的数据
我们可以在自定义类型中,通过重写iter()方法,让自定义对象返回一个迭代器对象,这样也就可以让自定义类型的对象来完成可迭代操作。
class Person:
def __init__(self, fav):
self.fav = fav
def __iter__(self):
print("迭代方法执行....")
return iter(self.fav)
# 创建一个Person对象
p = Person(["鸿钧道祖", "三清天尊", "女娲娘娘"])
# for循环遍历对象
for f in p:
print(f)
执行结果: