一、项目背景 2017年8月,“李文星遭BOSS直聘求职诈骗误入传销死亡”事件,让网络求职诈骗第一次大规模曝光在大众视野范围内。此后,网络招聘平...
1.案例说明 一般案例客户聚类分析流程(个人理解) 提取客户消费行为变量 对提取的行为变量进行正态化(使聚类结果更有商业解读意义),和Z-sco...
1.读取csv 2. 查看字段类型 同pandas [('PassengerId', 'int'),('Survived', 'int'),('...
1. 连接本地spark 2. 创建DataFrame 2.1 从变量创建 2.2 使用自动类型推断的方式创建dataframe 2.3 读取j...
1.案例说明 数据来源狗熊会,数据完整,无缺失值,错误值通过网球运动的技术指标探究运动员的技术水平对世界排名的影响 2.变量修改及探索性分析 读...
1.案例说明 通过已知获救数据,预测乘客生存情况 2.查看数据 3.数据预处理 其中Age,Cabin,Embarked有缺失值Age变量缺失率...
1. 案例说明 通过收集相关网站对酒店评价,poi地理数据,和酒店自身介绍探索影响酒店入住价格的因素数据来源:狗熊会 2.变量分析探索 查看酒店...
生成可视化决策树代码 错误解决方式 下载安装GraphViz(这是一个独立软件)https://graphviz.gitlab.io/_page...
1. mysql不是内部或外部命令 安装Mysql后,当我们在cmd中敲入mysql时会出现‘Mysql’不是内部或外部命令,也不是可运行的程序...