操作词汇的库很多nltk,jieba等等,gensim处理语言步骤一般是先用gensim.utils工具包预处理,例如tokenize,gens...
操作词汇的库很多nltk,jieba等等,gensim处理语言步骤一般是先用gensim.utils工具包预处理,例如tokenize,gens...
kaggle赛题链接Home Depot Product Search Relevance,这个题目关键点就是特征提取,给的数据需要观察处理,提...
岭回归 huber回归 第一幅图使用loss总和来评估回归效果,delta=1,损失最少,从第三幅图来看也是拟合效果最好的 第二幅图使用回归类的...
设为所有项目的集合,为事务数据库,事物是一个项目子集()。每一个事务具有唯一的事务标识。设是一个由项目构成的集合,称为。事务包含项集,当且仅当。...
加载数据 特征选择 为了方便后面可视化,我们只选取2个特征,通过自变量与因变量y相关系数来选择 还可以通过PCA降维来选择,本例降维后分类效果并...
DNN算法的基本思想 多层感知器在如何获取隐层的权值的问题上遇到了瓶颈。既然我们无法直接得到隐层的权值,能否先通过输出层得到输出结果和期望输出的...
之前无标签数据降维PCA,那么像下图带有标签数据,如果用PCA降维将会投影到v轴上,这个投影方差最大,数据将变成不可分状态,LDA将把数据投影加...
1、泊松分布 泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台...
scipy sin(x)/x算出来积分误差很大,即使近似值已经很接近pi了,注意我乘2了
Python中,如果在创建class的时候写了call()方法, 那么该class实例化出实例后, 实例名()就是调用call()方法。例子
专题公告
使用python实现机器学习算法