Python collection模块理解

Python中的基本数据结构有list,dict,tuple,set。Python还有一个功能比较强大的包collections,可以处理并维护一个有序的dict,可以提高程序的运行效率。

1、collections中defaultdict的使用

defaultdict在字典dict的基础之上添加一个参数default_factory(default_factory可以指定为list,set,int)
例子1:将下面的list转换成一个dict,其中key对应的value是一个list

>>from collections import defaultdict
>>l=[('a',2),('b',3),('a',1),('b',4),('a',3),('a',1),('b',3)]
>>d=defaultdict(list)
>>for key,value in l:
      d[key].append(value)
>>d
defaultdict(<class 'list'>,{'a':[2,1,3,1],'b':[3,4,3]}

例子2:例1中value中包含重复元素,如果我们不想要value中的元素重复,可以用defaultdict(set)来解决这个问题,set与list不同之处就是set中不允许存在相同的元素。

>>d = defaultdict(set)
>>for key,value in s:
      d[key].add(value)
>>d
defaultdict(<class 'set'>, {'a': {2,1,3}, 'b': {3,4}})

例子3:如果要统计一个字符串中每个字符出现的次数,可以使用defaultdict(int)

>sen='hello world'
>d=defaultdict(int)
>for key,value in sen:
     d[key]+=1
>d
defaultdict(<class 'int'>, {'o': 2, 'h': 1, 'w': 1, 'l': 3, ' ': 1, 'd': 1, 'e': 1, 'r': 1})

2、collections中OrdereDict的使用

字典dict是无序的,如果我们想要有序的dict,可以使用OrdereDict 。

例子1:

在讲例1之前先讲一下sorted函数的概念。
sorted(iterable,key,reverse),sorted一共有iterable,key,reverse这三个参数。其中iterable表示可以迭代的对象,例如可以是dict.items()、dict.keys()等,key是一个函数,用来选取参与比较的元素,reverse则是用来指定排序是倒序还是顺序,reverse=true则是倒序,reverse=false时则是顺序,默认时reverse=false。

下面我们利用sorted函数按key,value值对字典排序

>from collections import OrderedDic
>d={'b':3,'a':4,'c':2,'d':1}
# 将d按照key来排序
>OrderedDic(sorted(d.items(),key=lambda t:t[0]))
OrderedDic([('a',4),('b',3),('c',2),('d',1)])
# 按照value来排序
>OrderedDict(sorted(d.items(),key=lambda t:t[1]))
OrderedDic([('d',1),('c',2),('b',3),('a',4)])
# 按照key的长度来排序
>OrderedDic(sorted(d.items(),key=lambda t:len(t[0])))

这里的d.items()实际上是将d转换为可迭代对象,迭代对象的元素为(‘b’,3)、(‘a’,3)、(‘c’,2)、(‘d’,1),items()方法将字典的元素转化为了元组,而这里key参数对应的lambda表达式的意思则是选取元组中的第二个元素作为比较参数(如果写作key=lambda item:item[0]的话则是选取第一个元素作为比较对象,也就是key值作为比较对象。lambda x:y中x表示输出参数,y表示lambda函数的返回值),所以采用这种方法可以对字典的value进行排序。注意排序后的返回值是一个list,而原字典中的名值对被转换为了list中的元组。

例子2:例1中已经按照key排序的dict,使用使用popitem()方法来移除最后一个key-value对.如果我们要删除dict中的key-value,popitem(last=True)按照先进后出的顺序删除dict中的key-value,popitem(last=False)按照先进先出的规则删除dict中的key-value.

>d.popitem()
('d',1)
# 使用popitem(last=False)
>d.popitem(last=False)
('a',4)

例子3:如果我们想要改变有序的OrderedDict对象的key-value顺序,可以使用move_to_end(key,last=True)

>d = OrderedDict.fromkeys('abcde')
OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)])
# 将key为c的key-value移动到最后
>d.move_to_end('c')
# 将key为c的key-value移动到最前面
>d.move_to_end('c',last=False)
>''.join(d.keys())
cabde

3、collections中deque的使用

deque是为了向list中删除和插入的效率更高,用法与list相似,而list自带的append和pop方法(尾部插入和删除)速度慢

4、collections中ChainMap的使用

ChainMap可以合并多个dict,而且效率很高

>from collections import ChainMap
> a = {'a': 4, 'c': 2}
> b = {'b': 3, 'c': 1}
> c=ChainMap(a,b)
ChainMap({'a': 4, 'c': 2}, {'b': 3, 'c': 1})
# 将c变成一个list
>c.maps
[{'a': 4, 'c': 2}, {'b': 3, 'c': 1}]

5、collections中Counter的使用

例子1:若想统计相关元素出现的次数,可以使用Counter

>from collections import Counter
>cnt=Counter()
>for w in ['a','b','a','a','a','r','b']:
    cnt[w]+=1
Counter({'a': 4, 'b': 2, 'r': 1})
# 统计字符串出现的次数 前面有统计sen='hello world',用defaultdict(int)
>cnt = Counter()
> for ch in 'hello':
    cnt[ch] = cnt[ch] + 1
Counter({'l': 2, 'o': 1, 'h': 1, 'e': 1})

例子2:elements()方法按照元素的出现次数返回一个iterator(迭代器),元素以任意的顺序返回,如果元素的计数小于1,将忽略它。

>c = Counter(a=4, b=3, c=1, d=-4,e=0)
Counter({'a': 4, 'b': 3, 'c': 1, 'd': -4, 'e':0})
>sorted(c.elements())
['a', 'a', 'a', 'a', 'b', 'b','b','c']
# most_common(n)返回一个list, list中包含Counter对象中出现最多前n个元素。
>c = Counter('abracadabra')
Counter({'a': 5, 'b': 2, 'r': 2, 'd': 1, 'c': 1})
>c.most_common(3)
[('a', 5), ('b', 2), ('r', 2)]

6、collections中namedtuple的使用

命名tuple中的元素,使用namedtuple(typename,field_names)

>from collections import namedtuple
>nm=namedtuple('helloworld',['x','y'])
>n=nm(1,2)
>n__class__.__name__
'helloworld'
>n.x
1
>n.y
2
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容

  • http://python.jobbole.com/85231/ 关于专业技能写完项目接着写写一名3年工作经验的J...
    燕京博士阅读 7,539评论 1 118
  • 背景 一年多以前我在知乎上答了有关LeetCode的问题, 分享了一些自己做题目的经验。 张土汪:刷leetcod...
    土汪阅读 12,712评论 0 33
  • 一、python 变量和数据类型 1.整数 Python可以处理任意大小的整数,当然包括负整数,在Python程序...
    绩重KF阅读 1,603评论 0 1
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,494评论 18 139
  • 付爱宝商贸股份有限公司,成立于2014年7月31日,公司拥有自己的产品,有完全颠覆传统的商业模式。 目...
    艾哲宇阅读 194评论 0 0