![Avatar notebook default](https://cdn2.jianshu.io/assets/default_avatar/avatar-notebook-default-640f7dde88592bdf6417d8ce1902636e.png)
8篇文章 · 2724字 · 1人关注
Hadoop主要由HDFS + YARN + MapReduce三个核心组件组成,HDFS是一个文件系统,负责分布式存储;YARN是Hadoop...
Amazon EMR 是一个托管集群平台,可简化在 AWS 上运行大数据框架 (如 Apache Hadoop 和 Apache Spark) ...
在做决策时,ROC分析能不受成本/效益的影响,给出客观中立的建议。 分类模型(又称分类器,或诊断)是将一个实例映射到一个特定类的过程。ROC分析...
导入 前提条件: 我们使用真正的直接营销活动 direct marketing campaign 中的邮件回复数据集。每个记录都代表一个直接 m...
.csv 处理 这里学习 通过一个.csv文件进行基本的迭代,来创建字典和收集汇总统计。不过总的用一个词来描述 这个csv方法就是 tediou...
文集作者