1.topic分成多个partition的话,多个partition可以分布在多台机器上,为topic提供了无限大的横向拓展性
2. partiton分为多个segment的话,因为seqment的内容是一个数据文件加上一个索引文件,如果不分成多个segment,只有一个partition文件的话,partition会一直变大,对于已经过期的数据想做删除,会很麻烦。如果划分成segment的话,可以删除已经过期的整个segment文件
3. partition是文件夹,segment是里面的文件
我也是初学者,写这个只是做一下笔记
kafka高吞吐量的原因kafa 吞吐量高的原因 顺序读写 kafka的消息是不断追加到文件中的,这个特性使kafka可以充分利用磁盘的顺序读写性能 顺序读写不需要硬盘磁头的寻道时间,只需很少的扇区...