Q1。为什么需要连续监控?
我建议您遵循以下流程:
连续监视可以及时发现问题或弱点,并采取快速纠正措施来帮助减少组织的费用。持续监控提供的解决方案可解决以下三个运营准则:
- 持续审核
- 持续监控
- 连续交易检查
Q2。什么是Nagios?
您可以通过首先提到Nagios是监视工具之一来回答这个问题。它用于在DevOps文化中连续监视系统,应用程序,服务和业务流程等。如果发生故障,Nagios可以提醒技术人员该问题,使他们可以在故障影响业务流程,最终用户或客户之前开始补救流程。使用Nagios,您不必解释为什么看不见的基础设施中断会影响组织的底线。
现在,一旦定义了什么是Nagios,就可以提及使用Nagios可以实现的各种功能。
通过使用Nagios,您可以:
- 在过时的系统导致故障之前,计划基础架构升级。
- 在出现问题的第一个迹象时就响应问题。
- 检测到问题后自动修复问题。
- 协调技术团队的响应。
- 确保满足组织的SLA。
- 确保IT基础架构中断对组织的底线影响最小。
- 监控整个基础架构和业务流程。
这就完成了这个问题的答案。可以根据讨论的方向添加其他优点(如优势等)。
Q3。Nagios如何工作?
Nagios在服务器上运行,通常作为守护程序或服务运行。Nagios会定期运行驻留在同一服务器上的插件,它们会与您的网络或Internet上的主机或服务器联系。可以使用Web界面查看状态信息。如果发生问题,您还可以接收电子邮件或SMS通知。
Nagios守护程序的行为就像是在某些时刻运行某些脚本的调度程序。它存储这些脚本的结果,如果这些结果发生更改,它将运行其他脚本。
现在期待有关Nagios组件(如插件,NRPE等)的一些问题。
Q4。Nagios中的插件是什么?
通过定义插件来开始这个答案。它们是可从命令行运行以检查主机或服务状态的脚本(Perl脚本,Shell脚本等)。Nagios使用插件的结果来确定网络上主机和服务的当前状态。
定义插件后,请解释为什么我们需要插件。当需要检查主机或服务的状态时,Nagios将执行插件。插件将执行检查,然后将结果简单返回给Nagios。Nagios将处理从插件收到的结果,并采取必要的措施。
Q5。什么是Nagios中的NRPE(Nagios远程插件执行器)?
对于此答案,请简要介绍插件。NRPE插件旨在允许您在远程Linux / Unix计算机上执行Nagios插件。这样做的主要原因是允许Nagios监视远程计算机上的“本地”资源(例如CPU负载,内存使用情况等)。由于这些公共资源通常不会暴露给外部计算机,因此必须在远程Linux / Unix计算机上安装NRPE之类的代理。
我将建议您根据下图说明NRPE体系结构。NRPE附件由两部分组成:
- check_nrpe插件,位于本地监视计算机上。
- NRPE守护程序,在远程Linux / Unix计算机上运行。
监视主机和远程主机之间存在SSL(安全套接字层)连接,如下图所示。
Q6。您在Nagios中进行被动检查是什么意思?
据我说,答案应该从解释被动检查开始。它们由外部应用程序/过程启动和执行,并且被动检查结果被提交给Nagios进行处理。
然后说明被动检查的必要性。它们对于监视本质上异步的服务很有用,并且不能通过定期轮询其状态来有效地监视它们。它们还可以用于监视位于防火墙后面且无法从监视主机主动检查的服务。
Q7。 Nagios何时检查外部命令?
确保在解释过程中坚持提问,所以我建议您遵循以下提到的流程。Nagios在以下情况下检查外部命令:
- 由主配置文件中的command_check_interval选项指定的固定间隔,或者
- 事件处理程序执行后立即。这是对外部命令检查的常规周期的补充,并且在事件处理程序向Nagios提交命令时可以立即采取措施。
Q8。****Nagios中的主动和被动检查有什么区别?
对于这个答案,首先要指出主动和被动检查的基本区别。主动检查和被动检查之间的主要区别在于,主动检查由Nagios启动和执行,而被动检查则由外部应用程序执行。
如果您的面试官不满意上述说明,那么您还可以提及主动检查和被动检查的一些关键功能:
被动检查对于监视以下服务很有用:
- 本质上是异步的,因此无法通过定期轮询其状态进行有效监控。
- 位于防火墙后面,无法从监视主机主动进行检查。
Actives检查的主要功能如下:
- 主动检查由Nagios流程启动。
- 主动检查会定期进行。
Q9。Nagios如何帮助进行分布式监视?
面试官将期待与Nagios的分布式体系结构有关的答案。因此,我建议您以以下格式回答:
使用Nagios,您可以使用分布式监视方案监视整个企业,在该方案中,Nagios的本地从属实例执行监视任务,并将结果报告给单个主服务器。您可以从主服务器管理所有配置,通知和报告,而从属服务器则负责所有工作。该设计利用了Nagios利用被动检查的能力,即将结果发送回Nagios的外部应用程序或流程。在分布式配置中,这些外部应用程序是Nagios的其他实例。
Q10。解释Nagios的主要配置文件及其位置?
首先提到此主要配置文件包含的内容及其功能。主配置文件包含许多影响Nagios守护程序运行方式的指令。Nagios守护程序和CGI均读取此配置文件(它指定主配置文件的位置)。
现在,您可以知道它的位置以及创建方式。运行配置脚本时,将在Nagios发行版的基本目录中创建一个示例主配置文件。主配置文件的默认名称是nagios.cfg。它通常位于Nagios安装目录的etc /子目录中(即/ usr / local / nagios / etc /)。
Q11。解释襟翼检测在Nagios中如何工作?
我建议您先解释拍打。服务或主机更改状态的频率过高时会发生震荡,这会导致很多问题和恢复通知。
定义拍打之后,请说明Nagios如何检测拍打。每当Nagios检查主机或服务的状态时,它将检查其启动或停止震荡。Nagios按照以下给定的步骤进行操作:
- 存储主机或服务的最后21个检查的结果,分析历史检查结果并确定状态更改/转换发生的位置
- 使用状态转换来确定主机或服务的状态变化百分比值(变化的度量)
- 将状态变化百分比与低和高拍动阈值进行比较
当主机或服务的百分比状态变化首次超过高波动阈值时,便确定该主机或服务已开始波动。当主机或服务的百分比状态低于低震荡阈值时,将确定该主机或服务已停止震荡。
Q12。在Nagios中影响递归和继承的三个主要变量是什么?
根据我的说法,此答案的正确格式应为:
首先命名变量,然后对每个变量进行简短说明:
- Name
- Use
- Register
然后对这些变量中的每一个进行简要说明。名称是由其他对象使用的占位符。Use定义应使用其属性的“父”对象。寄存器的值可以为0(仅表示其模板)和1(实际对象)。寄存器值永远不会继承。
Q13。Nagios是面向对象的,这是什么意思?
这个问题的答案很直接。我将回答说:“ Nagios的功能之一是对象配置格式,因为您可以创建对象定义,该对象定义继承其他对象定义的属性,从而继承名称。这简化并阐明了各个组件之间的关系。”
Q14。Nagios中的状态跟踪是什么?
我建议您首先简要介绍一下状态跟踪。它用于记录目的。为特定主机或服务启用跟踪功能后,Nagios将非常仔细地监视该主机或服务,并记录检查结果输出中看到的所有更改。根据您和面试管之间的讨论,您还可以添加:“在以后分析日志文件时,这将非常有帮助。在正常情况下,仅在主机或服务自上次检查以来已更改状态时才记录主机或服务的检查结果。”