26篇文章 · 7990字 · 1人关注
告警群中出现服务重启并重新注册信息,上去排查重启原因,登录rancher上看,现在food-match-01这台机器上的服务已经挂了。 途中看到...
前几天收到反馈,k8s-uat集群部署业务会失败,上rancher上看下pod状态发现创建失败,随后展开了排查之路,今日在此记录: 首先通过报错...
问题: 上周开始公司托管在IDC机房的一台服务器频繁掉线,导致ssh连接不上,过几分钟又恢复。通过监控查看,没有什么有价值的结果,因为是对公网I...
切换成最近30分钟 排查过程:客户端,prometheus 时区都是正常时间,并且可以获取到当前数据。一个模板下只有个别图是这个情况,延迟30分...
二进制搭建的k8s集群。查看pod日志时,报权限错误 这个错误是说 kube-apiserver这个用户没有权限查看日志,我们要给这个用户一个a...
再删除pod的时候,卡在了终端,一直terminating状态。可执行以下命令强制删除
kubectl get pods -n kube-systemUnable to connect to the server: x509: ce...
禁用NetworkManager 1、systemctl stop NetworkManager 2、systemctl disable Net...
文集作者