240 发简信
IP属地:广东
  • 立个flag

    2018.12.29 写在2018的最后一个工作日 由于某些客观原因,这个lock down暂时是搞不定了,但是关于流水线以及cache的研究我...

  • Resize,w 360,h 240
    深入到NEON汇编层里面的float基本知识

    1. 问题 在IOS系统下有这么两个语句: Arch64: v0跟v14乘加到v16上,但是v16的值却跟v14一样,为何? Arch32: q...

  • Resize,w 360,h 240
    你猜 为什么A64为什么没有LDM和STM指令了,而是用LDP跟STP呢?

    一、前言 我们知道在Arm Arch32里面有个突发传输指令LDM、STM,也就是说可以一次传输多个值,到底是多少个呢?根据手册里面所说:加载和...

  • Resize,w 360,h 240
    ios获取cpu的实时频率(深入到汇编、硬件参数层)

    一 · 前因 具体细节项目相关不宜写出了~ 总之吧啦吧啦一顿分析,就怀疑CPU降频了,但是ios却没有获取实时频率的接口。 于是就有了这篇文章...

  • Resize,w 360,h 240
    AI 移动端框架常用指令·汇总(待续)

    卷积操作常用的汇编指令(NEON) 前言 首先我们要知道,ios的芯片虽然是ARM内核的,但是后来慢慢地魔改已经跟公版的ARM有所区别了,因此其...

  • 基于tensorRT方案的INT8量化实现

    链接崩了~改放知乎专栏链接好啦! 点我=>(链接在这)<=点我

  • Resize,w 360,h 240
    从winograd原理到实现及汇编优化

    一、预备知识 1.1 卷积操作 卷积的基本操作就是这样的:这仅是单通道的计算,多通道类似。 1.2 img2col 思路: 首先,为啥要有这玩意...

  • 内存对齐讨论[修正]

    源网址[英文] github上有大神翻译了一篇内存对齐的英文文献,我复现了一下过程; 发现其中有个地方有出入(strcut foo6{}),因此...

  • ARM分支指令汇编代码

    链接 Java分支结构 栗子: ARM的分支结构 对于这种根据不同情况选择不同值的语句,ARM在设计时专门有一条强大的csel指令,专门做这个事...

个人介绍
曰(yue):每日十立其身。

处于人工智能的洪流之中,专注于移动端图像算法优化。