虽然是翻译的原文,但是添加了有趣的旁白,让枯燥的学习生动有趣了
超简单!pytorch入门教程(一):TensorZen君的配置是macbook pro,升级到Mac Serria安装不了qt,无法显示图片,好在发现了pytorch,正好Zen君以前也玩过python的,所以非常激动。这...
虽然是翻译的原文,但是添加了有趣的旁白,让枯燥的学习生动有趣了
超简单!pytorch入门教程(一):TensorZen君的配置是macbook pro,升级到Mac Serria安装不了qt,无法显示图片,好在发现了pytorch,正好Zen君以前也玩过python的,所以非常激动。这...
Zen君的配置是macbook pro,升级到Mac Serria安装不了qt,无法显示图片,好在发现了pytorch,正好Zen君以前也玩过python的,所以非常激动。这...
链接 Java循环结构 Thumb的循环结构 C++代码与Java代码几乎是一字未改: 我们下面来看看16位的Thumb指令是如何实现循环的。 value参数传进来在r0; ...
一、前言 我们知道在Arm Arch32里面有个突发传输指令LDM、STM,也就是说可以一次传输多个值,到底是多少个呢?根据手册里面所说:加载和存储多个寄存器。寄存器r0到r...
1. 问题 在IOS系统下有这么两个语句: Arch64: v0跟v14乘加到v16上,但是v16的值却跟v14一样,为何? Arch32: q13跟q2乘加到q10,结果却...
卷积操作常用的汇编指令(NEON) 前言 首先我们要知道,ios的芯片虽然是ARM内核的,但是后来慢慢地魔改已经跟公版的ARM有所区别了,因此其对应配套的汇编规范也就有些细微...
原作大神的链接在这!!! ARM浮点运算 强大的ARM v8A芯片,已经不输于JVM的设计了,也是很简单。源代码: ARM v8a的浮点运算 汇编代码: 我们可以看到,寄存器...
源网址[英文] github上有大神翻译了一篇内存对齐的英文文献,我复现了一下过程; 发现其中有个地方有出入(strcut foo6{}),因此特地查了下文献,做了下修正,记...
喵喵喵???winograd什么时候更新呀
从winograd原理到实现及汇编优化一、预备知识 1.1 卷积操作 卷积的基本操作就是这样的:这仅是单通道的计算,多通道类似。 1.2 img2col 思路: 首先,为啥要有这玩意? 其次,这玩意是怎么做的? ...
一、预备知识 1.1 卷积操作 卷积的基本操作就是这样的:这仅是单通道的计算,多通道类似。 1.2 img2col 思路: 首先,为啥要有这玩意? 其次,这玩意是怎么做的? ...
链接崩了~改放知乎专栏链接好啦! 点我=>(链接在这)<=点我
是SenseNets啦……sensenet是SenseTime的框架吧
基于tensorRT方案的INT8量化实现链接崩了~改放知乎专栏链接好啦! 点我=>(链接在这)<=点我
@况辉 最初的版本未针对group进行分组量化,mobilenet v1/v2的top1大约下降1-2个点,最新版本已加入分组量化的功能,但是计算kld的过程非常久(12hours),而且貌似mobilenet-ssd也翻车了……未分组量化的mobilenet ssd的mAP下降7个点左右。其实还是kld+fine tuning 效果最好
基于tensorRT方案的INT8量化实现链接崩了~改放知乎专栏链接好啦! 点我=>(链接在这)<=点我
一 · 前因 具体细节项目相关不宜写出了~ 总之吧啦吧啦一顿分析,就怀疑CPU降频了,但是ios却没有获取实时频率的接口。 于是就有了这篇文章了! 二 · 面对困难·解决困...
UP的文章治疗好了我最近的失眠啊……感觉写neon assembly有时候完全是靠猜
什么?!NEON还要优化?官网介绍: NEON宏观介绍 NEON Programmer’s Guide Version: 1.0 直观认识 NEON整体描述Arm NEON technology is...
官网介绍: NEON宏观介绍 NEON Programmer’s Guide Version: 1.0 直观认识 NEON整体描述Arm NEON technology is...