一、交叉熵的由来 信息量香农提出的“信息熵”, 是用来解决信息量化问题。信息的不确定性越强, 需要用来表达的数据量也就越多。事件的不确定性通常是概率分布P来表示, 所以信息的...
一、交叉熵的由来 信息量香农提出的“信息熵”, 是用来解决信息量化问题。信息的不确定性越强, 需要用来表达的数据量也就越多。事件的不确定性通常是概率分布P来表示, 所以信息的...
Attention机制源于对Seq2Seq模型的几个问题优化。Seq2Seq是基于Encoder-Decoder架构思想实现。Encoder和Decoder部分都是采用RNN...
原生的 Azkaban 提供了强大的任务调度功能,但是面对复杂的业务要求,原生的Azkaban还是不能完全满足我们的需求。在对比Oozie、Airflow等流行的任务调度框架...
交叉验证是样本分成训练集和验证集, 设置一个指标,比如rmse, lambda取不同值, 看在训练集和验证集上指标的情况, 选指标最好时的lambda值。
回归系列之线性回归的关键问题如上篇文章, 岭回归、Lasso回归和ElasticNet 回归都是以普通的线性回归为基础,先列举下线性回归的模型公式: 岭回归为解决共线性问题,Lasso回归是为解决变量选...