业务场景
由于开发用的laravel框架,业务中用了很多job定时任务,时间几乎分布在全天的任何时间点(精确到秒),如果服务器时间校准出现时间跳跃的话,很有可能导致某些计划任务无法执行。
实现方法分析
首先想到的就是定时执行
20 3 * * * ntpdate 1.cn.pool.ntp.org >> /root/cron.log 2>$1
但是这样的话会导致如果任务A是在20:18:18执行,但是ntpdate从20:18:15开始校准,一下把服务器时间设置成了20:18:20秒,那么计划任务A就被跳过了,没有执行。
解决以上问题的方案
- 先用
ntpdate
每天同步一次(最好在闲时同步) - 然后用
ntpd
守护进程服务来校准。
为什么要这样做呢?原因如下
- ntpd在实际同步时间时是一点点的校准过来时间的,最终把时间慢慢的校正对。
- ntpdate不会考虑其他程序是否会阵痛,直接调整时间。
使用ntpdate导致的问题
不幸的是,ntpdate调整时间的方式就是我们所说的”跃变“:在获得一个时间之后,ntpdate使用(当误差大于0.5秒的时候,用settimeofday直接设置系统时间,小于0.5秒的时候用adjtime和偏移量来)设置系统时间,这有几个非常明显的问题:
- 这样做不安全。ntpdate的设置依赖于ntp服务器的安全性,攻击者可以利用一些软件设计上的缺陷,拿下ntp服务器并令与其同步的服务器执行某些消耗性的任务。由于ntpdate采用的方式是跳变,跟随它的服务器无法知道是否发生了异常(时间不一样的时候,唯一的办法是以服务器为准)。
- 这样做不精确。一旦ntp服务器宕机,跟随它的服务器也就会无法同步时间。与此不同,ntpd不仅能够校准计算机的时间,而且能够校准计算机的时钟。
- 这样做不够优雅。由于是跳变,而不是使时间变快或变慢,依赖时序的程序会出错(例如,如果ntpdate发现你的时间快了,则可能会经历两个相同的时刻,对某些应用而言,这是致命的)。
因而,唯一一个可以令时间发生跳变的点,是计算机刚刚启动,但还没有启动很多服务的那个时候。其余的时候,理想的做法是使用ntpd来校准时钟,而不是调整计算机时钟上的时间。
NTPD 在和时间服务器的同步过程中,会把 BIOS 计时器的振荡频率偏差,或者说 Local Clock 的自然漂移(drift)记录下来。这样即使网络有问题,本机仍然能维持一个相当精确的走时。
最后提醒一下使用vmware的各位,因为虚拟机的时钟不太正常,比正常速度慢好多秒,所以在虚拟机上测试ntpd很难得到理想的结果,我当年就是为这个问题耽搁了好几天。。