240 发简信
IP属地:山东
  • 120
    ROC和AUC介绍以及如何计算AUC

    1. 首先介绍下一些参数指标 精确率(Precision):Precision 真阳性率(True Positive Rate,TPR),灵敏度(Sensitivity),召...

  • 背包问题

    背包问题 在n个物品中挑选若干物品装入背包,最多能装多满?假设背包的大小为m,每个物品的大小为A[i]样例如果有4个物品[2, 3, 5, 7]如果背包的大小为11,可以选择...

  • 120
    Spark性能优化-数据倾斜调优

    Spark性能优化分为四个方面: 1、开发调优2、资源调优3、数据倾斜调优4、shuffle调优 数据倾斜调优 1. 使用Hive ETL预处理数据适用场景:导致数据倾斜的是...

  • Spark性能优化-资源调优

    Spark性能优化分为四个方面: 1、开发调优2、资源调优3、数据倾斜调优4、shuffle调优 资源调优 num-executors参数说明:该参数用于设置Spark作业总...

  • 120
    Spark性能优化-开发调优

    Spark性能优化分为四个方面: 1、开发调优2、资源调优3、数据倾斜调优4、shuffle调优 1. 开发调优 1.1 避免创建重复的RDD对于同一份数据,只应该创建一个R...

  • 120
    理解RDD、DataFrame、Dataset区别

    先上图 rdd 优点1.强大,内置很多函数操作,group,map,filter等,方便处理结构化或非结构化数据2.面向对象编程,直接存储的java对象,类型转化也安全缺点1...

  • 120
    关于SparkSQL中withColumn生成自增序列的一个坑

    多个分区情况下 首先我们创建一个RDD并设置分区数为2,然后转换成DataFrame,生成一列新的ID 然后我们看下生成的ID,可见同分区连续 一个分区情况下 我们使用coa...

  • 120
    Spark任务提交流程

    1. Spark运行原理 (1)sparkContext向资源管理器注册并申请资源(2)资源管理器根据预先设定的算法,在资源池里分配合适的Executor运行资源(3)应用(...

  • GoogLeNet

    GoogLeNet 前言 Inception V1(也称为GoogLeNet,命名致敬Google和LeNet),是2014年由Christian Szegedy提出的一种全...

  • 单例模式

    模式告白 我在任何时候都只有一个对象,常被用来管理共享资源,例如数据库的连接,线程池等。 定义 确保一个类只有一个实例,并提供一个全局访问点。 代码样例 懒汉方式 饿汉方式 ...

  • 快速排序

    快速排序 代码样例

  • 120
    VGGNet

    VGGNet Reference [1409.1556]Very Deep Convolutional Networks for Large-Scale Image Reco...

  • 120
    AlexNet

    AlexNet Reference Krizhevsky A, Sutskever I, Hinton G E. ImageNet Classification with D...

  • Hive SQL中关于反引号的使用

    Hive中“`”的使用 当遇到存在以下划线开头的字段的表时,例如“_c1”,如图所示 常规的无引号字段查询会报错,如图所示: 所以在Hive中使用SQL语句时,查询操作最好将...

  • sortBy和sortByKey使用举例

    首先读取数据 结果如下: 然后对某字段记录进行计数 结果如下: 使用sortByKey 结果如下: 使用sortBy 结果如下:

  • Python类中的private修饰符

    默认情况下,Python中的成员变量和方法都是public的,而Python中没有类似public、private等访问修饰符控制访问权限。 如果要使用私有变量需要在变量名或...