syat_e6da - 简书

IP属地：云南

Reinforcement Learning 重要性采样和Prioritized Experience Replay
今天详细阅读了Prioritized Experience Replay这篇论文，记录下心得体会。 Introduction online RL...

747 0 0
论文阅读：Graph Convolutional Reinforcement Learning
这篇论文主要介绍了DGN的算法，在DQN的基础上加了图网络，用于状态的融合。在多智能体环境下运用。relation kernel用的是self-...

2304 0 0

稀疏矩阵的4种存储方式
COO[https://www.geeksforgeeks.org/sparse-matrix-representation/]CSR[http...

636 0 0
GCN在推荐系统中的应用之GraphSage-based
GraphSage GraphSage是在论文Inductive Representation Learning on Large Graphs...

3336 0 0
GCN在推荐系统中的应用
图网络（graph neural network， GNN） Category： Recurrent Graph Neural Networks...

2528 0 0
为什么在分类问题中常用交叉熵而不是MSE或者平均误差?
交叉熵可以在得到正确结果的同时衡量模型的好坏；交叉熵在模型不能很好拟合的似乎求的偏导大，而模型拟合的差不多之后偏导变小。对比之下，MSE在训练...

1607 0 0
2020-12-07读论文：A Heterogeneous Graph Neural Model for Cold-start Recommendation
这篇文章的主要贡献点在于通过user-item interactions建立interactive graph，通过social network...

703 0 0

2020-12-03 - 2020-12-06 京东RL论文整理
把京东系的强化学习的论文复习整理一下。读论文：Recommendations with Negative Feedback via Pairw...

476 0 0
2020-12-02学习笔记
读论文：Reinforcement Learning to Rank in E-Commerce Search Engine: Formaliz...

333 0 0