240 发简信
IP属地:甘肃
  • Resize,w 360,h 240
    Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting

    摘要 多步(尺度)预测通常包含一个复杂的输入组合——包括静态(即时不变)协变量、已知的未来输入,以及其他仅在过去观察到的外生时间序列——没有任何...

  • Resize,w 360,h 240
  • Resize,w 360,h 240
    词嵌入Word Embedding

    传统表达:one-hot 将每个词表示为一个长长的向量。词袋:所有词的不重复构成。 这样做的缺陷:忽略了句子词频信息;面临高维困境(文本维度随着...

  • Resize,w 360,h 240
    RNN

    隐状态 记忆储存:h可以对序列数据提供特征,然后再转化为输出。 U、W:权值矩阵;b:偏置项;f:激活函数,在RNN中一般使用tanh。 一个箭...

  • Resize,w 360,h 240
    LSTM

    简介 在深度RNN中,由于多hidden layer,存在梯度爆炸和梯度消失的问题。而停止学习,RNN会忘记在长序列中学习到的东西,仅拥有短期记...

  • Resize,w 360,h 240
    关于CNN中的认知补充

    卷积 在听沈华伟老师讲授GCN中,他回顾了卷积操作,也让我对卷积更深的认识。例如他有讲到,卷积操作,实质上输入数组与卷积核作“卷积操作”,这里的...

  • CNN

    和BP网络不同的是,cnn的特点是权值共享(卷积核filter),并且不需要人工的特征分析。 在BP网络中,我们使用的是全连接,即每层神经元都会...

  • Resize,w 360,h 240
    tensorflow中keras.models()的使用总结

    初学者在调用keras时,不需要纠结于选择tf.keras还是直接import keras,现如今两者没有区别。从具体实现上来讲,Keras是T...

  • Resize,w 360,h 240
    one-hot与哑变量(dummy variable)

    one-hot encoding 关于one-hot编码的具体介绍,可以参考我之前的一篇博客,博客地址:特征提取方法: one-hot 和 IF...