240 投稿
收录了112篇文章 · 13人关注
  • Resize,w 360,h 240
    gpu-device-plugin源码分析

    源码分析 启动参数 参数名称对应环境变量类型参数说明默认值mig-strategyMIG_STRATEGYstringGPU上MIG设备的暴露策...

  • dcgm-exporter源码分析

    背景 在早期的GPU监控中我们会使用一些NVML工具来对GPU卡的基本信息进行采集,并持久化到监控系统的数据存储层。因为我们知道,其实通过nvi...

  • Resize,w 360,h 240
    cAdvisor原理解析

    简介 cAdvisor是Google开源的一款用于展示和分析容器运行状态的可视化工具。通过在主机上运行CAdvisor用户可以轻松的获取到当前主...

  • Resize,w 360,h 240
    K8s Device Plugin机制

    Device Plugin介绍 从 Kubernetes 1.8版本开始,提供了 Device Plugin 框架,设备厂商无需修改 Kuber...

  • Resize,w 360,h 240
    Argo Workflows快速入门

    介绍 Argo Workflows 是一个开源容器原生工作流引擎,用于在 Kubernetes 上编排并行作业。Argo Workflows 实...

  • Argo Workflows用户手册

    介绍 Argo Workflows 是一个开源容器原生工作流引擎,用于在 Kubernetes 上编排并行作业。Argo Workflows 实...

  • client-go认证方式

    直观上看,用户可以使用kubectl、客户端库或者REST请求来访问K8S API。而实际上,无论是kubectl还是客户端库,都是封装了RES...

  • Draino源码分析

    启动参数 参考:draino 入门[https://www.jianshu.com/p/cc6a45cf3208] 系统指标 指标名称Measu...

  • Draino 入门

    1. 简介 Draino 基于标签和 node conditions 自动排干 Kubernetes 节点。匹配了所有指定标签和任意指定 nod...

  • dcgm-exporter源码分析

    背景 在早期的GPU监控中我们会使用一些NVML工具来对GPU卡的基本信息进行采集,并持久化到监控系统的数据存储层。因为我们知道,其实通过nvi...