Methods for NER 利用规则(比如正则) 投票模型 (Majority Voting) baseline 利用分类模型非时序模型 逻...
上一篇文章讲到,如果数据是线性可分的,直接使用最大边距作为目标函数,但是如果数据是线性不可分的情况下,该目标函数是不可用的。那么如何处理线性不可...
回顾线性分类器 设D = {(x1,y1),(x2,y2),(x3,y3),......(xn,yn)},yi属于{-1,1},i = 1,2,...
先来看看高中学的导数,就是一元函数的切线称为导数 偏导数是针对多元函数的,我们以两个自变量为例,z=f(x,y),从导数到偏导数,也就是从曲线来...
流网络—最大流问题(Maximum-flow problem)image.png希望从0-7找到最大值,管道可以承载的最大值。 那么目标函数是o...
时间这东西真的是过的好快啊,不知不觉又过去了半个月了,现在已经是五月中旬了。坚持是最好的证明。 那么我们回归,如何优化目标函数?其实AI问题有个...
由之前的文章可知,目标函数为了防止过拟合或者限制参数,一般会加L1正则化和L2正则化,下面来介绍关于L1正则,Lasso正则,因为Lasso是可...
如果一个数据集中有很多的特征,但是不是所有的特征都是对模型有作用,或者作用非常小时,我们就需要剔除,那么我们用上面技术去选择特征呢? 第一种,穷...
为什么我们更喜欢Sparsity 如果维度太高,计算量也变得更高 在稀疏性的条件下,计算量只依赖非0项的个数 提高解释性