本周内容:
(1)deque&queue 和 stack 深度探索
(2)R-B tree 深度探索
(3)set/multiset深度探索
(4)map/multimap深度探索
(5)hashtable深度探索
(6)unordered容器概念
一 deque&queue 和 stack 深度探索
deque:deque的内存空间分布是小片的连续,小片间用链表相连,实际上内部有一个map的指针。其中buffer表示deque的缓冲区,每个buffer可以存放多个元素结点。并且每个buffer指针存放在vector容器中。每个iterator存放四个指针:cur、first、last、node,cur表示当前数据结点的指针,first表示buffer首指针,last表示buffer的尾指针,node表示这个iterator在vector中的指针地址。它模拟了一个连续的存储空间(实质表示连续分段的容器)。
deque实现代码如下,gnu2.9模板参数有三个,其中第三个BufSiz默认为0,可以由使用者自定buffer大小。
同样的,deque的iterator需要回答算法的五个问题,即上周的iterator traits。
- deque<T>::insert()源码解析
//在position处安插一个元素,其值为x
iterator insert(iterator position,const value_type& x){
if(position.cur == start.cur){ //如果安插点是deque最前端
push_front(x); //交给push——front()做
return start;
}
else if (position.cur == finish.cur) { //如果安插点是deque最尾端
push_back(x); //交给push——back()做
iterator tmp =finish;
--tmp;
return tmp;
}
else {
return insert_aux(position,x);
}
}
template<class T,class Alloc,size_t BufSize>
typename deque<T,Alloc,BufSize>::iterator
deque<T,Alloc,BufSize>::insert_aux(iterator pos,const value_type& x){
difference_type index = pos - start; //安插点之前的元素个数
value_type x_copy =x;
if (index<size()/2){ //如果安插点之前的元素个数较少
push_front(front()); //在最前端加入与第一元素同值的元素
...
copy(front2,pos1,front1); //元素搬移
}
else{ //安插点之后的元素个数较少
push_back(back()); //在尾端加入与最末元素同值的元素
...
copy_backward(pos,back2,back1); //元素搬移
}
*pos = x_copy; //在安插点上设定新值
return pos;
}
deque是如何模拟连续空间的呢?全都是deque iterators的功劳,源代码做了大量的操作符重载,尤其是遇到buffer边界时如何跳到控制中心,使得deque的iterator能够在buffer之间模拟出连续空间。实现代码如下:
reference operator[] (size_type n)
{
return start[difference_type(n)];
}
reference front(){return *start;}
reference back()
{
iterator tmp = finish;
--tmp;
return *tmp;
}
size_type size() const {return finish - start;}
bool empty() const {return == start;}
reference operator*() const {return *cur;}
pointer operator->() const {return & (operator*());}
//两根iterators之间的距离相当于
//(1)两根iterators间的buffers的总长度+
//(2)itr至其buffer末尾的长度+
//(3)x至其buffer起头的长度
difference_type
operator-(const self& x) const
{
return difference_type(buffer_size())*(node-x.node-1)+
(cur-first)+(x.last-x.cur);
//首尾buffers之间的buffers数量
//(cur-first)末尾(当前)buffer的元素量,(x.last-x.cur)起始buffer的元素量
}
queue和stack底层都是由deque完成的,通常他们也被称为容器适配器。
-
queue
-
stack
- stack和queue都不允许遍历,也不提供iterator。
- stack和queue都可选择list和deque作为底层容器
- queue不可选择vector作为底层结构,stack可选择vector作为底层结构
- stack和queue都不可选择set或map做底层结构
二 R-B tree 深度探索
- Red-Black tree(红黑树)是平衡二元搜寻树(balanced binary search tree)中常被使用的一种。平衡二元搜寻树的特征:排列规则有利于search和insert,并保持适度平衡,即无任何节点过深。
- re_tree提供“遍历”操作及iterators。按正常规则(++ite)遍历,便能获得排序状态(sorted)。
- 我们不应使用rb_tree的iterators改变元素值(因为元素有其严谨排列规则)。编程并未阻止此事。如此设计是正确的,因为rb_tree即将为set和map服务(作为其底部支持),而map允许元素的data被改变,只有元素的key才是不可被改变的。
- rb_tree提供两种insertion操作:insert_unique()和insert_equal( )。前者表示节点的key一定在整个tree中独一无二,否则安插失败;后者表示节点的key可重复。
红黑树的使用如下:
三 set/multiset深度探索
- set/multiset以rb_tree为底层结构,因此有元素自动排序特性。排序的依据是key,而set/multiset元素的value和key合一:value就是key。
- set/multiset提供“遍历”操作及iterators。按正常规则(++ite)遍历,便能获得排序状态(sorted)。
- 我们无法使用set/multiset的iterators改变元素值(因为key有其严谨排列规则)。set/multiset的iterator是其底部的RB tree的const-iterator,就是为了禁止user对元素赋值。
-
set元素的key必须独一无二,因此其insert()用的是rb_tree的insert_unique()。multiset元素的key可以重复,因此其insert()用的rb_tree的insert_equal().
四 map/multimap深度探索
- map/multimap以rb_tree为底层结构,因此有元素自动排序特性。排序的依据是key。
- map/multimap提供“遍历”操作及iterators。按正常规则(++ite)遍历,便能获得排序状态(sorted)。我们无法使用map/multimap的iterators改变元素的key(因为key有其严谨排列顺序),但可以用它来改变元素的data。因此map/multimap内部自动将user指定的key type设为const,如此便能禁止user对元素的key赋值。
-
map元素的key必须独一无二,因此其insert()用的是rb_tree的insert_unique()。multimap元素的key可以重复,因此其insert()用的是rb_tree的insert_equal()。
五 hashtable深度探索
有一大堆的东西要放在容器里,每一个东西可以折射成一个数值,这些数值的变化如果有2^32种变化,所需要的空间要非常大,hashtable就是用来解决这个问题。
当碰撞的元素超过“篮子”的个数,经验判断为危险,则将“篮子”的数量扩大为原来的两倍,一般篮子数量是素数。GUC初始篮子数量为53,两倍变成106,附近的素数而且比106大的为193.
我们可以使用hashtable iterators改变元素的data,但不能改变元素的key(因为hashtable根据key实现严谨的元素排列)。
hashtable源代码如下:
第一第二个参数与红黑树为底层的set和map类似,第三个模板参数hashFcn的目的是希望根据元素值算出一个hash code(一个可进行modulus运算的值),使得元素hash code映射之后能够够杂乱够随机地被置于hashtable内,越是乱,越是不容易碰撞,可以传函数、仿函数、函数对象,它是通过模板偏特化实现,c风格的字符串char*是一个指针,stl提供了实现方式,而C++的字符串string则需要自己写实现方式;第四个ExtractKey告诉我们如何取出key;第五个EqualKey告诉我们如何比较key大小;第六个分配器。
六 unordered容器概念
从C++11开始,以hash开头的容器都改为unordered容器(不定序容器)
- Before C++11
- hash_set
- hash_multiset
- hash_map
- hash_multimap
- Since C++11
- unordered_set
- unordered_multiset
- unordered_map
- unordered_multimap