今天本来想用anaconda来更新python的库,但是发现无论怎么做,使用pip3 show都是默认路径下的库。 为了解决该方法,需要这样做: export PYTHONP...
今天本来想用anaconda来更新python的库,但是发现无论怎么做,使用pip3 show都是默认路径下的库。 为了解决该方法,需要这样做: export PYTHONP...
PyTorch模型训练最开始就是数据读取以及预处理模块,而该模块包括了两个重要的入口,第一个是用于将disk中的数据读取路径预处理好的ImageFolder方法: 第二个方法...
2021年的ATC会议所有文章已经放出来,这里放出链接https://www.usenix.org/conference/atc21/technical-sessions[h...
Optane非易失性内存代码实测: 使用PMDK中的obj封装好的库进行:
Merci打包方案 1 超图划分 将所有的数据划分为等大小的子图,降低打包数量。面临的问题:现有算法生成的子图都是固定大小,浪费空间; 2 设计关系感知的可变聚类方案 开始的...
今天总结一篇ISCA20的文章:Centaur: A Chiplet-based, Hybrid Sparse-Dense Accelerator for Personali...
在DLRM中有对训练集做处理的函数,我们对训练序列做了研究, 重点是这个地方,其中E是所有打包好的Embedding: 其中第一维为这个Embedding table中包括的...
DRAM非常重要,但是我发现我并没有真正的懂DRAM的整个架构与执行流程。 上图为DRAM的硬件结构,右图CAP为电容,WL表示一个晶体管。若要DRAM密度变大,则会使得取C...
今天看到一篇非常好的知乎blog,学到了如何在PyTorch下由python端的代码调用C代码。 一、目标 在DNN训练的过程中为了从Python端调用C的代码,方便接下去的...
这篇文章是PPOPP'18的文章,感觉在该方向的共享度比较大,从16年的vDNN开始,到18年该论文再到20年ASPLOS的Capuchin,方案每两年前进一步。这里将这个文...
主要是对题目的这个问题太好奇了,于是就看了一下源码,并有了如下的总结。 一、问题起因 经常写PyTorch模型的人会写:output = model(images)来进行前项...
一、前言 我以为我真正了解计算机的总线原理,后来发现,通过跟实验室同学交流下,我发现我们都浮在表面,没有真正的对这问题详细思考,本文就总结一下今天的讨论结果。 本文深入解释了...
Squeezenet 测试对象:Squeezenet - 256 - cifar10测试种类:改变线程1 4 10;添加数据增强选项 1 GPU使用率 GPU占用最高的为10...
本文为清华大学存储课程中DRAM部分的学习记录 NVM介绍 DRAM的不足之处:1 为了保存数据需要充放电-费电;2 不能做的很小; 1 PCM通过热度改变其状态(晶态与非晶...
最近完善了一个Python库,做到了使用一行命令便可以获取到DNN网络的大小情况。现在进行发布,方便研究人员使用。 一、前言 为了获取到神经网络模型的feature map以...
本文将指导用户如何将DIY的python包上传至Pypi官网,从而可以通过pip3 install进行下载。 一、文件准备 我们需要准备如下文件: 其中蓝色的为文件夹,白色的...
记录一下CKPT部分的阅读,为后期研究做铺垫。 首先在主函数中定位save函数的位置,进入: 这里初始化了一个OutputArchive类的archive对象,而该对象可以理...