MNIST手写字识别
废话不多说,先上演示https://yuanyuangong.github.io/gyytensor/dist/index.html#/home
上面这个链接请复制,打开,简书有毒
如果你家网络掉渣,就直接 git 吧!HTTPS://GITHUB.COM/YUANYUANGONG/GYYTENSOR.GIT
第一记:手写字数据形式
在开篇最前面还是先讲讲手写字识别深度学习原理。
这里测试用的手写字图片 为(28*28*1)的图像,因为只有黑 所以 像素为 1。
当然js可不认识这么个,需要转成 一个 28*28 的二维向量矩阵。 感受一下这个二维数组,
如果 7 这个数字 都这么标准就好了,现实和残酷,我写的7是这样的,我们就需要找到不同人写的7的共同点,这就是提取特征,在我这个案例中 就用 卷积 (不要去管高等数学里的卷积,你就当是全新的一种方式,下面会讲解)的方式去提取。
第二记 卷积
先看一下tensorflow 里如何卷积的吧(再次强调不要被 卷积这个名词 带 到坑里去了,这里你就理解为 操作,没有其他意思)
首先,
需要过滤器的卷积窗口来取样,蓝色就(5*5)过滤器 ,在这个案例里就是5*5 的二维0,1 数组, 至于里面的值完全由tensorflow去初始化,
步进 strides: 1, 意味着 这个过滤器每一移动一个像素,从左到右 跑完 下移动一个像素,如下图,总需要拖多少次。
28-5 = 24 。24/1 = 24 则 24*24次 当然你也可以把步长设置为6 ,那就是 那就24/6 则4*4 =16次。不过这样你会丢失很多信息。
这么个5*5的过滤器 拖了24*24 次得到 一个 24*24 的数组 g 。假设过滤器的 值为 f ,那么 g[n][m] = f * 过滤器所拖的区域。
这里有8 个过滤器,那就得到 8个 24*24 的矩阵。 这样我们就把 7 这个图 搞了 8个特征,如果你写了一个7 ,通过 同样的 卷积,也等到 8 个24*24 的矩阵,进行比较。看看相差多少。再去优化 那8个过滤器。
当然现实里 可不会这么简单。为了进一步提高 学习效率。我们要有一些其他手段,比如吃补药。---池化
第三记 池化
poolSize , 2*2 的窗口,每次移动2 个像素 得到 6*6的矩阵。
我们一次卷积和池化还不行,多来几次 ,完整代码如下
第四记 flaten 和全链接层
原理什么的不重要了,flaten 就是把多维数组转成 一维数组,方便统计操作,全链接dense 就是为了分类。
先分成64类,在分成0-9 10类
第五记 开始训练模型
第一步,数据获取,预处理。下面数MNIST手写字数据链接,不是人可以看懂的数据,所以需要预处理,通过webapi
new Img() ,具体的我就不肺炎了,反正最后通过data.js可以获得手写字数据。
第二步,载入数据,这里,不可一个个载到模型里去跑,太慢,也不能一次性把所有数据载入,浏览器要炸的。所以分批次,
model.fit 载入数据 直到 所有数据被处理完就停止 循环,应该 内置 setIntertime 方法
第四步,验证模型获得 测试结果 (准确率)
第六记,UI 绘图部分
这里用canvas绘制手写字的图片,并显示预测结果。
echart显示损失率,和精确率的曲线
最后:
本人是新接触tensorflow.js的新人,还望各路大仙指点一二