小白谈分布式数据库设计2——存储模块设计

存储模块

我们将存储模块分为内存存储和磁盘存储。借鉴Hbase和Cassandra的设计思想,我们先对操作写日志(CommitLog),然后将写入的数据先存储到内存中的某个结构中(Memtable),当满足一定的条件时(大小时间等限制),将Memtable按照我们定义的格式写入SSTable.这里主要是借鉴Cassandra的存储结构,仍然以行为单位进行存储.Hbase的列存储,每一个单独的cell都存储了大量重复的字段,如果表的列设计过多,会浪费大量的存储.我们先做大量的接口设计
对于内存中的数据,我们需要先设计两个功能型接口,HeapSize和Snapshot。功能型接口,就是一看接口名就知道他的功能是什么,顾名思义,HeapSize就是获取当前对象占用内存,Snapshot就是获取一个快照,类似于深度克隆。

public interface HeapSize {
    long heapSize();
}

public interface Snapshot<T> {
    T snapshot();
}

列单元Colum设计

最底层存储单元,我们设计IColumn接口,方法暂定为获取ColumnName,ColumnValue,Timestamp,Type(插入,删除);

public interface IColumn extends Comparable<IColumn>{
     byte[] getColumnName();
     byte[] getColumnValue();
     long getTimestamp();

    Type getType();

    enum Type {
        Put((byte) 4),

        Delete((byte) 8),

        DeleteColumnFamily((byte) 12);

        private final byte code;

        Type(final byte c) {
            this.code = c;
        }

        public byte getCode() {
            return this.code;
        }
    }
}

Rowkey设计

至于Rowkey的设计,暂时还没有考虑完善,暂且定位一个获取key值的接口。

public interface Rowkey extends Comparable<Rowkey>{
    byte[] getKey();
}

ColumFamily设计

ColumnFamily,代表一列数据,数据结构采用ConcurrentSkipListMap<String, IColumn>;

public interface IColumnFamily extends HeapSize{
    void add(String key, IColumn column);
    IColumn get(String key);
    Map<String, IColumn> getFamily();
}

Memtable设计

每个表在内存中的数据用Memtable表示,简单表示就是Map<Rowkey, ColumnFamily>;
这里需要注意的一点是,Memtable在写磁盘的时候,真是写入的数据是Memtable的副本。读写要如何进行。这里我们的策略是写入到新的Mentable中,读取数据可以到Mentable中读取,但是不能修改。
达到一定条件,使用特定的线程池来写磁盘;

public class Memtable implements HeapSize, Snapshot<Memtable> {
    private NavigableMap<Rowkey, IColumnFamily> memtable = new ConcurrentSkipListMap<>();

    private volatile boolean flush;
    private transient long heapSize;
    
    private SSTableWirter<Memtable> ssTableWirter;

    public Memtable(NavigableMap<Rowkey, IColumnFamily> memtable) {
        this.memtable = memtable;
    }

    public void add(Rowkey rowKey, IColumn column){
        if(flush) return;
        IColumnFamily old = memtable.get(rowKey);
        if(old == null) {
            IColumnFamily newFamily = new ColumnFamily();
            newFamily.add(new String(column.getColumnName()), column);
            memtable.put(rowKey, newFamily);
        }else {
            old.add(new String(column.getColumnName()), column);
        }
    }

    public long getHeapSize() {
        return heapSize;
    }

    public IColumnFamily getFamily(Rowkey rowKey){
        return memtable.get(rowKey);
    }

    public NavigableMap<Rowkey, IColumnFamily> getMemtable() {
        return memtable;
    }

    /**
     * if ready to flush to disk
     * @return
     */
    private boolean checkFlush() {
        return heapSize > 111;
    }

    private void flushToDisk(){
        Memtable snapshot = snapshot();
        flush = true;
        Constant.SERVICE.submit(new Runnable() {
            @Override
            public void run() {
                ssTableWirter.write(snapshot);
            }
        });
    }

    @Override
    public long heapSize() {
        return heapSize;
    }


    @Override
    public Memtable snapshot() {
        NavigableMap<Rowkey, IColumnFamily> readOnly = new ConcurrentSkipListMap<>(memtable);
        return new Memtable(readOnly);
    }

}

磁盘存储SSTable

SSTable的读写,这里使用装饰模式。IFileReader和IFileWriter包装IFile,SSTableReader和SSTableWriter又包装IFileReader和IFileWriter。SSTable中保存相应的SSTableReader和索引,来快速完成数据读取
SSTable的写入与读取我们暂时只设计了接口,省去了具体的细节,比如文件的组织形式是B+Tree,而这样一整套内存和B+Tree的存储机制又称为LSM Tree。这些细节的代码,可以留着以后完成。并且上述所有的设计以及代码的细节都有很大的优化空间,不是可以一蹴而就的工作。

public class SSTable {
    private IndexBlock indexBlock;
    private SSTableReader<IColumnFamily> tableReader;
    private volatile boolean isWritable;

    private String getTableName(){
        return null;
    }
    public IColumnFamily getFamily(Rowkey rowkey){
        return null;
    }
}

SSTableWriter

public interface SSTableWirter<T> {
    void write(T t);
}

SSTableReader

public interface SSTableReader<T> {
    T read(long start, long size);
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,607评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,047评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,496评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,405评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,400评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,479评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,883评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,535评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,743评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,544评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,612评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,309评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,881评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,891评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,136评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,783评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,316评论 2 342

推荐阅读更多精彩内容