回不回去过年在结婚第一年就要谈好,不是临了才决定的,他这么不顾你和二宝,估计不是他一个人的问题,你们要好好交流交流,找到问题所在,找到解决问题的方法,不能听之任之,家庭是需要经营的,出问题也不是哪一个人的问题,应该双方都有责任!
回不回去过年在结婚第一年就要谈好,不是临了才决定的,他这么不顾你和二宝,估计不是他一个人的问题,你们要好好交流交流,找到问题所在,找到解决问题的方法,不能听之任之,家庭是需要经营的,出问题也不是哪一个人的问题,应该双方都有责任!
1. AB测试简介 1.1 什么是AB测试 A/B测试[https://zh.wikipedia.org/wiki/A/B%E6%B8%AC%E8%A9%A6]为一种随机测...
1. 简介 正则表达式[https://zh.wikipedia.org/wiki/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F...
1. 启发 在业务上,我们常常会碰到这样的需求例如原始表如下: uidstatetimea10anull1anull2a33bnull4b25bnull6 需要变成如下: u...
在了解U统计量与AUC之间的关系前,先复习一下Mann-Whitney U Test首先放上AUC在统计上的意义: 随机选取一个正例和一个负例,分类器给正例的打分大于分类器给...
1. 基本概念 决策树模型为非参数监督模型,该模型为根据一系列的if-else逻辑组合而成。树可以看作是一个分段函数,并且树的层数越深,就会更贴合数据(fitted)。 显然...
评估方法 留出法 Hold-out“留出法”将两个数据集拆分为两个互斥的集,一般训练集为70%,测试集为30%。这样使用测试集得出的测试误差(testing error)更具...
关于机器学习整体的概念,例如监督模型与无监督模型的概念,见笔者的之前的一篇文章机器学习入门[https://www.jianshu.com/p/7bb45c460e6b] 线...
Hassan Kibirige[https://github.com/has2k1]开发的plydata[https://github.com/has2k1/plydata]...
多维Index Columns和Rows都可以创建多层Index 每层的index也可以拥有自己的名字 Index排序 根据Level聚合 表连接 表拼接 数据透视&逆透视 ...
Series Series是一个一维的向量,每个值都会有对应标签,该标签我们称之为Index 通过Index可以对Series进行查询以及修改 Numpy函数,以及其他类Nu...
ndarry: 多维度的向量 Numpy为Numerical Python的缩写,是数据分析最重要的包之一,很多数据分析相关的包会依赖Numpy中的向量类型。 向量类的数据配...
Python基础 数据类型 tuple tuple是一个固定长度,不可修改的对象 tuple可以tuple中的一个元素 tuple可以将一个Sequence转换为tuple ...
基于树模型(Tree-Based Models) 基于树模型,比如决策树,梯度提升树,随机森林等,相对比回归模型,是较为好解释的(Interpret) 决策树(Decisio...
机器学习数据管道(Machine Learning Pipeline) Pipeline的概念,在很多机器学习的模型中都存在,是一个种整理以及操控数据的方法。在MLlib中,...
在学习Spark的MLlib之前,我们简略的回忆整理一下机器学习的概念。 Machine Learning(机器学习) 机器学习模型主要有以下几种分类: Supervised...
前言 Hive是数仓建设使用频率最高的一项技术,基于各种业务需求,使用功能函数会为我们的开发提高了很多效率。本篇是基于笔者在日常开发中使用频率较高的函数做一次总结(同时也会给...
collect, collect_list, collect_set collect常用的有两个函数:collect_list(不去重)和collect_set(去重) co...
UDF 为了满足用户的不同的分析需求,Spark允许使用者自己定义函数,供用户在Spark SQL中使用。例如数据科学家可以将一个机器学习模型封装在一个函数内,提供给数据分析...
Spark SQL为Spark提供了以下几个特性: 提供高级结构框架的API(见Learning Spark [3]) 允许读取不同格式的数据(json, hive, tab...