Evaluating Classification and Predictive Performance 评估识别与预测的效果 经典(简单原始)的分类识别器(classifi...
Evaluating Classification and Predictive Performance 评估识别与预测的效果 经典(简单原始)的分类识别器(classifi...
【关键词:Sampling,Dimensionality Reduction】 取样(Sampling): 关键点: 1)取样的点可以代表/拟合整体数据的某些特性(我们需要的...
【关键词:数据降维,PCA】 PCA(Principal Components Analytics)重要数据的定位分析: 详细讲解PCA的博客 意义:取最能表现数据趋势的一些...
【关键词:可视化表示法,使用Q-Q图验证数据的分布,数据量小的时候使用BootStrap重采样统计分析数据,Dummy Variable来减少Categories】 可视化表...
【关键词:典型的数据问题,孤立点(Outlier),数据标准化(Normalizing Data),过拟合再验证。】 变量的类型 1)数字型(Numeric):连续型数字&离...
文档(document):序列化的JSON数据 1. 文档元数据 三个必须的元数据节点为_index,_type,_id 1. index名称必须全部小写,不能以下划线开头,...
一个驱动浏览器来进行操作及获取指定元素的库 selenium官网API主要用于获取无法直接得到的js网页,与需要与浏览器进行交互的操作。Slenium可以用Phantomjs...
主要用途为获取网页元素。 1. 解析器类型 2. 基本使用 1)使用prettify()来进行补全与处理获取网页元素的错误 2)选择器 a)得到BeautifulSoup对象...
Mine Data 1. 商业上进行Data Mining的意义: 1)时时刻刻有许多数据在产生并被存储。(随着电子产品的升级,用户数据复杂并趋向平民化)2)电脑性价比变得...
引用:OLAP最近由于很多人问我什么是OLAP,从而发现目前OLAP对大多数人来说还是个新名词,这里我来简单讲讲OLAP(联机分析)。联机分析(OLAP)是由关系数据库之父E...
Requests方法的简单使用: 使用requests对象 将传递的信息封装出来使用 获取传递的Json文件 获取传递的二进制文件(图片等) 拓展使用 添加headers(有...
它是python自带的HTTP请求库 1)urllib.request:请求库 example:a) get方法获取: b) post方法获取: c)超时(timeout)功...
爬虫基本流程: 1) 发起请求: 通过HTTP库向目标站点发起请求,即发送request(请求可以包含额外的headers等信息)等待服务器响应。 2) 获取响应内容: 得到...
python环境安装 MongoDb环境及安装 用于存储结构化字典数据。 Redis环境anzhaung 分布式爬虫使用,因为redis高效 需要用密码登陆:auth 密码密...
几个重要的名词(持续更新) 1. 节点(node) 运行着的ElasticSearch实例。 2. 集群(cluster) 一组具有相同cluster.name的节点的集合(...
聚合操作 1. 分组 最终根据tags得出每组的数量 2. 搜索+聚合 就是简单的先搜索后聚合 3.先分组,再算每组的平均值 用一种聚合嵌套的方式来实现。首先以tags分组,...
所以一般的设计模式,可以设置一个主页App,然后通过单点登陆代理来访问其它App。现在要讨论的重点就是:1) 能否通过CAS Server实现不同用户的权限控制(比较基础的思...
1. CAS的直观认识 主要参考:CAS的官网CAS的视频教程 CAS的结构 a) CAS Server 用于完成对用户信息的认证,需要单独部署(本次学习中使用tomcat进...
整体印象:用于维护一个或多个State,在整个Vue工程中共享数据 数据仓储模型 数据同步模型 使用Vuex仓库 要使用vuex仓库,需要先安装vuex组件。之后引入Vuex...