IP属地:香港
1,前言 很久不发文章,整理些干货,希望相互学习吧。进入主题,本文主要时说的为朴素贝叶斯分类算法。与逻辑回归,决策树一样,是较为广泛使用的有监督...
刚好最近经常看一些word2vec的文章,在最后往往看到作者说用t-SNE可视化结果,也即把高维度的数据降维并可视化。很奇怪作者为何不用PCA或...
Elasticsearch一般首要解决的问题: 首先是中文分词(目前默认是IK,建议看下是否有没其他更好的方案或可优化得点) 其次相关性(搜索关...
由于语料缺乏,前期若使用到情感分析,建议暂时使用SnowNLP(此模块主要使用淘宝评论语料)做情感挖掘,但不仅仅为单纯调用,需要优化,下面是一些...
搜狗新闻与清华新闻文章都是偏新闻类别,若要商品类别文本,则需要爬取,代码如下,参考https://www.cnblogs.com/sirkevi...
Gradient boosting is one of the most powerful techniques for building pr...
目前我们的推荐算法单一且标签质量一般,随着业务量的增加需要使用多推荐算法融合: 1)生成推荐商品候选集算法选择: 度算法融合的选型:**基于标签...