元数据作用
Hbase有存储在zookeeper的metadata来定位RegionServer,
而LevelDB也通过元数据管理模块去感知每一层有哪些SST文件;快速的定位某条数据所在的SST文件;以及重启后恢复到之前的状态。
作用概括如下:
记录Compaction相关信息,使得Compaction过程能在需要的时候被触发;
维护SST文件索引信息及层次信息,为整个LevelDB的读、写、Compaction提供数据结构支持;
负责元信息数据的持久化,使得整个库可以从进程重启或机器宕机中恢复到正确的状态;
记录LogNumber,Sequence,下一个SST文件编号等状态信息;
以版本的方式维护元信息,使得Leveldb内部或外部用户可以以快照的方式使用文件和数据。
实现
LeveDB用Version表示一个版本的元信息,Version中主要包括一个FileMetaData指针的二维数组,分层记录了所有的SST文件信息。FileMetaData数据结构用来维护一个文件的元信息,包括文件大小,文件编号,最大最小值,引用计数等,其中引用计数记录了被不同的Version引用的个数,保证被引用中的文件不会被删除。
VersionSet是一个Version构成的双向链表,这些Version按时间顺序先后产生,记录了当时的元信息,链表头指向当前最新的Version,同时维护了每个Version的引用计数,被引用中的Version不会被删除,其对应的SST文件也因此得以保留,通过这种方式,使得LevelDB可以在一个稳定的快照视图上访问文件。VersionSet中除了Version的双向链表外还会记录一些如LogNumber,Sequence,下一个SST文件编号的状态信息。
Version更新
leveldb中只要文件变动应用在旧的Version上可以得到新的Version。而这个更新信息都保存在VersionEdit中。
即:
Version N + VersionEdit = Version N+1
进程崩溃以及恢复
为了避免进程崩溃或机器宕机导致的数据丢失,LevelDB需要将元信息数据持久化到磁盘,承担这个任务的就是Manifest文件。可以看出每当有新的Version产生都需要更新Manifest,很自然的发现这个新增数据正好对应于VersionEdit内容。
在Manifest中的一次增量内容称作一个Block,其内容如下:
Manifest Block := N * Item
Item := [kComparator] comparator
or [kLogNumber] 64位log_number
or [kPrevLogNumber] 64位pre_log_number
or [kNextFileNumber] 64位next_file_number_
or [kLastSequence] 64位last_sequence_
or [kCompactPointer] 32位level + 变长的key
or [kDeletedFile] 32位level + 64位文件号
or [kNewFile] 32位level + 64位 文件号 + 64位文件长度 + smallest key + largest key</pre>
last_sequence
记录了向leveldb中写入的记录总数,写数据时被使用
WriteBatchInternal::SetSequence(updates, last_sequence + 1);//对WriteBatch的序号+1
last_sequence += WriteBatchInternal::Count(updates);//加上此次写入的记录数,即为此时已经写入的记录总数
/* ...... */
versions_->SetLastSequence(last_sequence);//将其保存在VersionSet中</pre>