论文:《Visualizing and Understanding Convolutional Networks》 一、为什么CNN这么牛逼 本篇文章主要讲解2014年ECC...
深层网络更适合模组化 在比较浅层网络与深层网络时,要让“矮胖”的网络和“高瘦”的网络的参数数目相等,这样比较才公平。 即便是在深层网络参数较少的情况下,深层网络也会比浅层网络...
在我的印象中,我应该是一个积极乐观遇到问题总想着去解决的男生,但是我发现我现在越来越懒惰了。 尤其是如果这一天的一开始没有找到比较好的状态,我就是倾向于这一整天都不再学习,就...
你有个任务,需要用到某个开源项目;或者老大交代你一个事情,让你去了解某个东西。怎么下手呢?如何 开始呢?我的习惯是这样: 1.首先,查找和阅读该项目的博客和资料,通过goog...
台湾大学李宏毅老师的机器学习课程是一份非常好的ML/DL入门资料,这篇文章是学习本课程第10课所做的笔记和自己的理解。 1. 前言 神经网络中的每一个神经元与DNN(深度学习...
本笔记是针对李宏毅教授在b站上的视频《ML Lecture 9-1:Tips for Training DNN》的学习笔记的下半半部分。 1.正则化(Regularizati...
本笔记是针对李宏毅教授在b站上的视频《ML Lecture 9-1:Tips for Training DNN》的学习笔记的下半部分。 自适应学习率(Adaptive Lea...
本笔记是针对李宏毅教授在b站上的视频《ML Lecture 9-1:Tips for Training DNN》的学习笔记。 问题:texting data的效果不好?是过拟...
1.1 Keras是什么 Keras是基于Theano的一个深度学习框架,它的设计参考了Torch,用Python语言编写,是一个高度模块化的神经网络库,支持GPU和CPU。...
注:Macbook pro 13' 没有NVIDIA的显卡,没办法CUDA编程,所以下面都是CPU编程。 2018.3.7更新: 建议大家直接安装anaconda,然后通过a...
1.1 为什么要用 Backpropagation 在神经网络中求解最优模型参数,使用的梯度下降算法和之前求线性回归方程中用的没有太大的区别,都是不断的计算微分,然后更新参数...
以手写数字识别为例: 第一步:选择模型: step3:找到最优解 利用gradient descent寻找最优模型,但是因为深度学习的函数太复杂,要直接计算微分的话,计算量实...
一.deep learning的发展史 1.perceptron感知机 假设数据集线性可分,perceptron的目标就是找到一个超表面,使得wx+b=0可以将两类区分开。 ...
logistics的缺点:对于线性不可分的数据没有办法分类,此时考虑在Logistic回归建模之前对特征进行转化,如图,左图中线性不可分的数据在特征转化后可以很好地被红色直线...
多类分类问题,现在考虑多分类问题,例如有类别C1,C2,C3的数据,推导的思路和Logistic回归一样,Logistic回归等价于softmax回归只有两类的情况。
1.generation Vs discrimination 对于discrimination模型,我们没有经过任何假设,仅仅是通过训练得出w b 参数。往往对于genera...