一、数据结构 1.1 数据结构定义 数据结构是计算机存储、组织数据的方式。数据结构是相互之间存在一种或者多种特定关系的数据元素的集合。数据结构=物理结构+逻辑结构 ...
一、数据结构 1.1 数据结构定义 数据结构是计算机存储、组织数据的方式。数据结构是相互之间存在一种或者多种特定关系的数据元素的集合。数据结构=物理结构+逻辑结构 ...
1. 进程与线程的区别 进程是具有一定功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源调度和分配的一个独立单位 线程是进程的实体,是CPU调度和分派的基本单位,...
一 面试题概述 面试的时候,面试官会结合你的回答和你的简历来询问你,所以在写简历的时候,简历上所写的所有内容在写的时候必须自己反问一下自己,这个知识点懂不懂。 面试其实是一个...
在前面的两讲中,我们分别介绍了拉格朗日乘子法和在有不等式约束情况下最优解必须满足的KKT条件,接下来我们就可以利用这些来求解我们的最大间隔分类器了。 1、问题回顾 在第四讲中...
这篇文章主要参考了如下两篇博文,并加入了自己的理解。 SVM入门(八)松弛变量 SVM入门(九)松弛变量(续) 前言 这篇文章首先探讨了SVM为什么会对噪声敏感的问题,然后引...
Notepad
Python获取命令行参数方法我们知道,把通过命令行执行python脚本很简单,直接执行python+文件路径+文件名就可以了 如果想在命令行执行py脚本的时候对python脚本传参数,应该如何完成? 这...
1、python 字典json字符串中文乱码怎么办? #这是因为中文以 unicode 编码了,而默认是以ASCII解析的,中文不在ASCII编码中,所以无法显示。 data...
一、需求 对登记纳税人的注册地址进行相似度计算,发现单个纳税人可能存在的一址多注册。 二、数据 数据来源:登记纳税人数据 数据量:百万级 部分数据展示: 三、数据预处理 1,...
相信学过java框架的对AOP应该是很熟悉了,那什么是面向切面编程AOP呢? AOP 简言之、这种在运行时,编译时,类和方法加载时,动态地将代码切入到类的指定方法、指定位置上...
一、概述 1.1 spark概述 Apache Spark是一个流行的实时处理框架,它可以通过内存计算的方式来实时的进行数据分析。它起源于Apache Hadoop MapR...
我们知道,把通过命令行执行python脚本很简单,直接执行python+文件路径+文件名就可以了 如果想在命令行执行py脚本的时候对python脚本传参数,应该如何完成? 这...
之前单位的CDH集群部分组件老是会挂掉,每天人为的检查和重启服务,太麻烦,故写个相关服务监控的脚本发送消息和自动重启服务。 一、环境准备 Python3.6,使用的库文件如下...
一、问题现象说明: 1, IQL在执行数据量超过1亿条数据的时候,执行不出来结果 2, 在执行超过四秒以后Yarn的node节点开始出问题 3,关闭执行以后查看CPU、内存 ...
一、问题现象 1,同样一个执行语句在Spark-shell中就可以执行,但是在Spark-submit中执行时等待了很长时间但是Task一直没有执行 2,通过Spark-su...
CDH集群,所需要和后续需要的一些配置。
一、下载 下载地址:http://www.kafkatool.com/download.html 我们的kafka版本是2.11(kafka_2.11-2.0.0-cdh6....
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员M...