SEO:Search Engine Optimization ,中文译为“搜索引擎优化”。在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引...
SEO:Search Engine Optimization ,中文译为“搜索引擎优化”。在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引...
出现Import Error: No module named 'exceptions'的解决方法 安装库 找到pip3.exe的位置,在当前路径下打开powershell,...
来一起看看《明天你好》的评论词云吧,利用Python爬取网易云音乐中相应歌曲的所有评论,并利用这些评论制作歌曲的专属词云。 先来了解一下wordcloud个参数的意思 bac...
Series Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数 据即可产生最简单的Serie...
1、np.linspace(start,end,num)start代表起始的值,end表示结束的值,num表示在这个区间里生成数字的个数,生成的数组是等间隔生成的。start...
矩阵乘法的dot NumPy提供了一个用于矩阵乘法的dot函数 numpy.linalg中有一组标准的矩阵分解运算以及诸如求逆和行列 式之类的东西 常用的线性代数函数...
数组转置和轴对换 转置(transpose)是重塑的一种特殊形式,它返回的是源数据的视 图(不会进行任何复制操作)。数组不仅有transpose方法,还有一个特 殊的T属性 ...
NumPy(Numerical Python的简称)是高性能科学计算和数据分析 的基础包。NumPy的ndarray:一种多维数组对象ndarray是一个通用的同构数据多维容...
颜色 color或c color = 'r'color = 'red'color = '#66ccff'color = '#8866ccff',88代表透明度color = ...
分类模型的评估 estimator.score() 一般最常见使用的是准确率,及预测结果正确的百分比 混淆矩阵:在分类任务中,预测结果与正确标记之间存在四个不同组合,构成混淆...
机器学习算法分类 监督学习(预测)分类:K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络回归:线性回归、岭回归标注:隐形马尔可夫模型 无监督学习聚类:K-mea...
sklearn数据集 1. 数据集的划分 训练集 : (占数据集比重高) 用于训练,构建模型 测试集 : 在模型评估时使用,检验评估模型是否有效 训练集测试集建立模型评估模...
数据降维 降维:特征的数量 特征选择 主成分分析 特征选择 冗余:部分特征的相关的高,容易消耗计算性能 噪声:部分特征对于预测结果有影响 filter(过滤式)、embedd...
线性归一化 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行...
文件特征抽取 作用:对文本数据进行特征值化 类:sklearn.feature_extraction.text.CountVectorizerCountVectorizer(...
祝大家新年快乐,身体健康,事业有成!新的一年要继续学习呀 K均值算法(K-means)聚类关键词:K个种子,均值聚类的概念:一种无监督的学习,事先不知道类别,自动将相似的对象...
KNN是将样本归为距样本最邻近的k个样本中大多数所属的类别。 算法实现:1、计算出每一个样本点与测试点的距离2、选取距离最近的K个样本,并获取他们的标签 label3、然后找...
一、什么是K近邻算法? 定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 来源: KNN算法最早是由...