源码分析 启动参数 参数名称对应环境变量类型参数说明默认值mig-strategyMIG_STRATEGYstringGPU上MIG设备的暴露策...
源码分析 启动参数 参数名称对应环境变量类型参数说明默认值mig-strategyMIG_STRATEGYstringGPU上MIG设备的暴露策...
背景 在早期的GPU监控中我们会使用一些NVML工具来对GPU卡的基本信息进行采集,并持久化到监控系统的数据存储层。因为我们知道,其实通过nvi...
简介 cAdvisor是Google开源的一款用于展示和分析容器运行状态的可视化工具。通过在主机上运行CAdvisor用户可以轻松的获取到当前主...
Device Plugin介绍 从 Kubernetes 1.8版本开始,提供了 Device Plugin 框架,设备厂商无需修改 Kuber...
介绍 Argo Workflows 是一个开源容器原生工作流引擎,用于在 Kubernetes 上编排并行作业。Argo Workflows 实...
介绍 Argo Workflows 是一个开源容器原生工作流引擎,用于在 Kubernetes 上编排并行作业。Argo Workflows 实...
直观上看,用户可以使用kubectl、客户端库或者REST请求来访问K8S API。而实际上,无论是kubectl还是客户端库,都是封装了RES...
启动参数 参考:draino 入门[https://www.jianshu.com/p/cc6a45cf3208] 系统指标 指标名称Measu...
1. 简介 Draino 基于标签和 node conditions 自动排干 Kubernetes 节点。匹配了所有指定标签和任意指定 nod...
背景 在早期的GPU监控中我们会使用一些NVML工具来对GPU卡的基本信息进行采集,并持久化到监控系统的数据存储层。因为我们知道,其实通过nvi...