神经网络算法的优势与应用

人工神经网络（ANN）以大脑处理机制作为基础，开发用于建立复杂模式和预测问题的算法。

首先了解大脑如何处理信息：
在大脑中，有数亿个神经元细胞，以电信号的形式处理信息。外部信息或者刺激被神经元的树突接收，在神经元细胞体中处理，转化成输出并通过轴突,传递到下一个神经元。下一个神经元可以选择接受它或拒绝它，这取决于信号的强度。

neuron-4steps

[图片上传失败...(image-cc0d9d-1512012156403)]

现在，让我们尝试了解 ANN 如何工作：

how-neural-net-works

这里， $w_1$ ， $w_2$ ， $w_3$ 给出输入信号的强度

从上面可以看出，ANN 是一个非常简单的表示大脑神经元如何工作的结构。

为了使事情变得更清晰，用一个简单的例子来理解 ANN：一家银行想评估是否批准贷款申请给客户，所以，它想预测一个客户是否有可能违约贷款。它有如下数据：

customer-table-1.jpg

所以，必须预测列 X。更接近 1 的预测值表明客户更可能违约。

基于如下例子的神经元结构，尝试创建人造神经网络结构：

neural-net-architecture

通常，上述示例中的简单 ANN 结构可以是：

[图片上传失败...(image-1b4516-1512012156403)]

与结构有关的要点：

它捕获输入之间的非线性关系
它有助于将输入转换为更有用的输出。
在上面的例子中，所用的激活函数是 sigmoid：
$$O_1=1+e^{-F}$$
其中 $F=W_1*X_1+W_2*X_2+W_3*X_3$
Sigmoid 激活函数创建一个在 0 和 1 之间的输出。还有其他激活函数，如：Tanh、softmax 和 RELU。

类似地，隐藏层导致输出层的最终预测：

$$O_3=1+e^{-F_1}$$
其中 $F_1=W_7*H_1+W_8*H_2$
这里，输出值（ $O_3$ ）在 0 和 1 之间。接近 1（例如0.75）的值表示有较高的客户违约迹象。
权重 W 与输入有重要关联。如果 $w_1$ 是 0.56， $w_2$ 是 0.92，那么在预测 $H_1$ 时， $X_2$ ：Debt Ratio 比 $X_1$ ：Age 更重要。
上述网络架构称为「前馈网络」，可以看到输入信号只在一个方向传递（从输入到输出）。可以创建在两个方向上传递信号的「反馈网络」。
一个高精度的模型给出了非常接近实际值的预测。因此，在上表中，列 X 值应该非常接近于列 W 值。预测误差是列 W 和列 X 之差：

customer-table-2

获得一个准确预测的好模型的关键是找到预测误差最小的「权重 W 的最优值」。这被称为「反向传播算法」，这使 ANN 成为一种学习算法，因为通过从错误中学习，模型得到改进。
反向传播的最常见方法称为「梯度下降」，其中使用了迭代 W 不同的值，并对预测误差进行了评估。因此，为了得到最优的 W 值，W 值在小范围变化，并且评估预测误差的影响。最后，W 的这些值被选为最优的，随着W的进一步变化，误差不会进一步降低。要更详细地理解解梯度下降，请参考：
http://www.kdnuggets.com/2017/04/simple-understand-gradient-descent-algorithm.html

ANN 有一些关键优势，使它们最适合某些问题和情况：

ANN 有能力学习和构建非线性的复杂关系的模型，这非常重要，因为在现实生活中，许多输入和输出之间的关系是非线性的、复杂的。
ANN 可以推广，在从初始化输入及其关系学习之后，它也可以推断出从未知数据之间的未知关系，从而使得模型能够推广并且预测未知数据。
与许多其他预测技术不同，ANN 不会对输入变量施加任何限制（例如：如何分布）。此外，许多研究表明，ANN 可以更好地模拟异方差性，即具有高波动性和不稳定方差的数据，因为它具有学习数据中隐藏关系的能力，而不在数据中强加任何固定关系。这在数据波动非常大的金融时间序列预测（例如：股票价格）中非常有用。

图像处理和字符识别：ANN 具有接收许多输入的能力，可以处理它们来推断隐蔽、复杂的非线性关系，ANN在图像和字符识别中起着重要的作用。手写字符识别在欺诈检测（例如：银行欺诈）甚至国家安全评估中有很多应用。图像识别是一个不断发展的领域，广泛应用于社交媒体中的面部识别，医学上的癌症治疗的停滞以及农业和国防用途的卫星图像处理。目前，ANN 的研究为深层神经网络铺平了道路，是「深度学习」的基础，现已在计算机视觉、语音识别、自然语言处理等方向开创了一系列令人激动的创新，比如，无人驾驶汽车。
预测：在经济和货币政策、金融和股票市场、日常业务决策（如：销售，产品之间的财务分配，产能利用率），广义上都需要进行预测。更常见的是，预测问题是复杂的，例如，预测股价是一个复杂的问题，有许多潜在因素（一些已知的，一些未知的）。在考虑到这些复杂的非线性关系方面，传统的预测模型出现了局限性。鉴于其能够建模和提取未知的特征和关系，以正确的方式应用的 ANN，可以提供强大的替代方案。此外，与这些传统模型不同，ANN 不对输入和残差分布施加任何限制。更多的研究正在进行中，例如，使用 LSTM 和 RNN 预测的研究进展。

ANN 是具有广泛应用的强大的模型。以上列举了几个突出的例子，但它们在医药、安全、银行、金融、政府、农业和国防等领域有着广泛的应用。

未完待续：课程内容较多，请复制链接通过电脑学习，获得最佳学习效果。 http://datacademy.io/lesson/174
更多课程和文章尽在微信号：「datartisan数据工匠」

image