页高速缓存是Linux内核实现磁盘缓存,主要用来减少对磁盘的I/O操作,这么做的原因是:
- 访问磁盘的速度远远低于访问内存的速度
- 临时局部原理:数据一旦被访问,就很有可能在短期内再次被访问到。
一、缓存手段
页高速缓存是由内存中的物理页面组成的,其内容对应磁盘上的物理块。页高速缓存大小能力可以动态调整,被缓存的存储设备称为后备存储。
1.1 写缓存
缓存一般有三种策略:
- 不缓存:不缓存任何写操作
- 写透缓存(write-through cache):写操作将自动更新内存缓存,同时也更新磁盘文件,缓存数据和后备存储保持同步。
- 回写策略:Linux采用的策略,写操作直接写到缓存中,后备存储不会立即更新,而是将页高速缓存中被写入的页面标记成脏,并加入到脏页链表中。然后由一个回写进程周期将脏页链表中的页回写到磁盘中,从而使磁盘和内存中的数据一致。最后清理脏页标志。
1.2 缓存回收
Linux缓存回收是通过选择干净页进行简单替换。如果缓存中没有足够的干净页,内核将强制进行回写操作,以腾出更多的干净可用页。最难的事情在于决定什么页应该回收,相关策略有:
- 最近最少使用(LRU):跟踪每个页面的访问踪迹(或按照访问时间为序的页链表),以便能回收最老时间戳的页面(或回收排序链表头所指的页面)。
- 双链策略(LRU/2):维护两个LRU链表,即活跃链表和非活跃链表。前者不会被换出,后者的页面可以被换出。活跃链表的页面必须在其访问时就处于非活跃链表上,如果活跃链表对于非活跃链表,那么前者的头页面被重新放回非活跃链表中。
二、Linux页高速缓存
页高速缓存缓存的是内存页面。缓存中的页来自对正规文件、块设备文件和内存映射文件的读写。
页高速缓存中的页可能包含多个不连续的物理磁盘块,Linux使用address_space结构体管理缓存项和页I/O操作。
每个缓存文件只和一个address_space结构体相关联:
/**
* struct address_space - Contents of a cacheable, mappable object.
* @host: Owner, either the inode or the block_device.
* @i_pages: Cached pages.
* @gfp_mask: Memory allocation flags to use for allocating pages.
* @i_mmap_writable: Number of VM_SHARED mappings.
* @nr_thps: Number of THPs in the pagecache (non-shmem only).
* @i_mmap: Tree of private and shared mappings.
* @i_mmap_rwsem: Protects @i_mmap and @i_mmap_writable.
* @nrpages: Number of page entries, protected by the i_pages lock.
* @nrexceptional: Shadow or DAX entries, protected by the i_pages lock.
* @writeback_index: Writeback starts here.
* @a_ops: Methods.
* @flags: Error bits and flags (AS_*).
* @wb_err: The most recent error which has occurred.
* @private_lock: For use by the owner of the address_space.
* @private_list: For use by the owner of the address_space.
* @private_data: For use by the owner of the address_space.
*/
struct address_space {
struct inode *host;
struct xarray i_pages;
gfp_t gfp_mask;
atomic_t i_mmap_writable;
#ifdef CONFIG_READ_ONLY_THP_FOR_FS
/* number of thp, only for non-shmem files */
atomic_t nr_thps;
#endif
struct rb_root_cached i_mmap;
struct rw_semaphore i_mmap_rwsem;
unsigned long nrpages;
unsigned long nrexceptional;
pgoff_t writeback_index;
const struct address_space_operations *a_ops;
unsigned long flags;
errseq_t wb_err;
spinlock_t private_lock;
struct list_head private_list;
void *private_data;
} __attribute__((aligned(sizeof(long)))) __randomize_layout;
物理页中包含了address_space结构体指针:
struct page {
unsigned long flags;//页的状态
atomic_t _count;//引用计数
atomic_t _mapcount;
unsigned long private;
struct address_space *mapping;
pgoff_t index;
struct list_head;
void *virtual;//页的虚拟地址
};
三、缓冲区高速缓存
独立的磁盘块通过块I/O缓冲也要被存入页高速缓存,称为缓冲区高速缓存。
四、flusher线程
在以下情况下,内核会唤醒一个或多个flusher线程对脏页进行回写:
- 当空闲内存低于一个阈值时,内核必须将脏页回写到磁盘,使脏页变为干净页,然后便可以回收干净页以释放内存。
- 当脏页在内存中驻留时间超过阈值时,内核必须将超时脏页写会磁盘,以确保脏页不会无限期驻留在内存中。
- 当用户进程调用sync()和fsync()系统调用时,内核会按要求执行回写动作。