240 投稿
收录了10篇文章 · 3人关注
  • Resize,w 360,h 240
    【TVM系列十一】Relay可视化

    一、前言 TVM是通过Relay进行模型计算图IRModule的构建,并且可以使用不同的优化策略(即Pass)对IRModule进行优化,最终编...

  • 【TVM系列九】FFI注册机制

    一、前言 TVM通过PackedFunc机制实现了Python与C++之间的相互调用,即FFI(Foreign Function Interfa...

  • 【TVM系列七】TVMC介绍

    一、前言 TVMC是TVM python包提供的一个工具,可以通过命令行的方式执行auto-tuning,编译,性能profiling以及模型运...

  • 【TVM系列五】添加Relay自定义算子

    一、前言 本文以实现一个axis_abs的自定义算子为例介绍如何在tvm中添加新的relay算子,该算子实现的功能是以输入的3维tensor取某...

  • Resize,w 360,h 240
    【TVM系列六】PackedFunc原理

    一、前言 在TVM中,PackedFunc贯穿了整个Stack,是Python与C++进行互相调用的桥梁,深入理解PackedFunc的数据结构...

  • Resize,w 360,h 240
    【TVM系列四】模型编译与运行过程

    一、前言 针对神经网络模型的编译,TVM封装了非常简洁的python接口,如下: 在上一篇文章中介绍了模型的算子转换与Relay IR Modu...

  • Resize,w 360,h 240
    【TVM系列三】算子转换调用流程

    一、前言 本文将从源码分析一个算子在TVM中是如何从前端到后端的转换过程。首先来看一下keras模型编译推理的一个示例:通过pip安装好kera...

  • Resize,w 360,h 240
    【TVM系列八】microTVM在ESP32上调优算子

    一、前言 本文主要介绍如何基于ESP32的开发板通过microTVM进行一个卷积算子的调优。 二、microTVM microTVM是TVM 编...

  • Resize,w 360,h 240
    【TVM系列二】TVM介绍

    一、TVM的工作流程 TVM主要由两个部分组成: (1)TVM编译器:负责编译和优化模型 (2)TVM runtime:提供目标设备上运行模型的...

  • Resize,w 360,h 240
    【TVM系列一】开发环境搭建

    一、前言 众所周知,深度学习的计算量庞大,在追求效率与实用性的工业界,深度学习所面临的一个最大的问题就是如何在不影响模型精度的前提下将算法模型部...