@一个菜鸟的自我修养 感谢作者详细的回复,受益匪浅,谢谢!
FM模型的一些理解的实操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 本文仅仅只是对文章的一些个人理解。本章先回顾一下...
@一个菜鸟的自我修养 感谢作者详细的回复,受益匪浅,谢谢!
FM模型的一些理解的实操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 本文仅仅只是对文章的一些个人理解。本章先回顾一下...
@一个菜鸟的自我修养 第二个问题,是我理解错了,以为编号从1开始。关于第一个问题(假设仅针对离散特征),按照文中的编码方式,先把所有特征展开,再重新编码,最后进行one-hot编码,这样有可能导致最终的特征维度相当大且稀疏。我比较疑惑,这种编码方式(特征全展开,重编码,再独热)跟其他编码方式(对单列特征onehot或label encoding)有什么优势或劣势吗?我查了相关资料,这些做法应该都有。另外,想问下,作者是如何考虑连续特征不做处理还是进行分桶离散化的情况
FM模型的一些理解的实操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 本文仅仅只是对文章的一些个人理解。本章先回顾一下...
文中说get_feature_dict做了独热编码,但是并未发现啊
另外,在get_feature_dict第11行:range(total_feature, total_feature + len(unique_feature)),range的第一个元素和第二个元素,是否应该+1呢
FM模型的一些理解的实操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 本文仅仅只是对文章的一些个人理解。本章先回顾一下...