240 发简信
IP属地:甘肃
  • 时间序列预测的评估指标补遗

    本文链接:个人站 | 简书 | CSDN版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。 在《销量预测中的误差指标分析》一文中,我们介绍...

  • 120
    Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting

    摘要 多步(尺度)预测通常包含一个复杂的输入组合——包括静态(即时不变)协变量、已知的未来输入,以及其他仅在过去观察到的外生时间序列——没有任何关于它们如何与目标相互作用的先...

  • 120
  • 120
    词嵌入Word Embedding

    传统表达:one-hot 将每个词表示为一个长长的向量。词袋:所有词的不重复构成。 这样做的缺陷:忽略了句子词频信息;面临高维困境(文本维度随着词数变化而变化);忽略了词语上...

  • 120
    RNN

    隐状态 记忆储存:h可以对序列数据提供特征,然后再转化为输出。 U、W:权值矩阵;b:偏置项;f:激活函数,在RNN中一般使用tanh。 一个箭头表示对相应的向量做一次类似于...

  • 120
    LSTM

    简介 在深度RNN中,由于多hidden layer,存在梯度爆炸和梯度消失的问题。而停止学习,RNN会忘记在长序列中学习到的东西,仅拥有短期记忆。 长短期记忆网络能够学习长...

  • 120
    关于CNN中的认知补充

    卷积 在听沈华伟老师讲授GCN中,他回顾了卷积操作,也让我对卷积更深的认识。例如他有讲到,卷积操作,实质上输入数组与卷积核作“卷积操作”,这里的卷积操作并不是我最初认识的。即...

  • CNN

    和BP网络不同的是,cnn的特点是权值共享(卷积核filter),并且不需要人工的特征分析。 在BP网络中,我们使用的是全连接,即每层神经元都会把各自权重分别的传递给下一层神...

  • 120
    tensorflow中keras.models()的使用总结

    初学者在调用keras时,不需要纠结于选择tf.keras还是直接import keras,现如今两者没有区别。从具体实现上来讲,Keras是TensorFlow的一个依赖(...

  • 120
    one-hot与哑变量(dummy variable)

    one-hot encoding 关于one-hot编码的具体介绍,可以参考我之前的一篇博客,博客地址:特征提取方法: one-hot 和 IF-IDF[http://www...

  • ROC曲线

    简介 受试者工作特征曲线(receiver operating characteristic curve,简称ROC曲线),是比较两个分类模型好坏的可视化工具。 作用 1.较...