进击的小恶魔 - 简书

发简信

进击的小恶魔

32
关注
9
粉丝
46
文章
10585

字数
12

收获喜欢
2

总资产

IP属地：广东

进击的小恶魔

hive的排序函数 rank()，dense_rank()，row_number() 区别
建表：插入数据：执行排序代码：输出结果：全国排名TOP5的大学有20所，我怀疑就是用dense_rank() 计算的。。另外，不常用的排序函数还有：percent_...

1860 0 1
进击的小恶魔

spark 窗口函数
spark窗口函数有哪些？

749 0 1

进击的小恶魔

scala 匿名函数
定义 Scala 中定义匿名函数的语法很简单，箭头左边是参数列表，右边是函数体。使用匿名函数后，我们的代码变得更简洁了。下面的表达式就定义了一个接受一个Int类型输入参数的匿...

752 0 0
进击的小恶魔

hive中 count(1)，count(*)，count(某字段)的区别
区别 count(*)：所有行进行统计，包括NULL行count(1)：所有行进行统计，包括NULL行count(column)：对column中非Null进行统计性能性...

1620 0 0
进击的小恶魔

hive表内部表和外部表的区别
内部表与外部表的区别未被external修饰的是内部表（managed table），被external修饰的为外部表（external table）；区别：内部表数据由H...

463 0 0
进击的小恶魔

sql中使用left join时on和where的区别
on 是临时表生成的条件where会对已经生成的临时表进行条件过滤

256 0 0
进击的小恶魔

178.分数排名
链接：https://leetcode-cn.com/problems/rank-scores 编写一个 SQL 查询来实现分数排名。如果两个分数相同，则两个分数排名（Ran...

602 0 0

进击的小恶魔

sqoop笔记
执行以下语句时，报错：错误日志：原因分析：Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure H...

832 0 0
进击的小恶魔

IDEA 配置maven(踩坑最终版)
下载mavenhttp://maven.apache.org/download.cgi 解压后，拷贝到： /library最终目录是： /Library/apache-ma...

1617 0 0
进击的小恶魔

mac 查看已安装的JDK版本以及目录
终端输入：/usr/libexec/java_home -V 输出：最下面一行的内容，就是当期那正在使用的JDK版本以及路径

1596 0 0
进击的小恶魔

scala学习笔记

375 0 0
进击的小恶魔

hive面试题
http://bigdatastudy.net/show.aspx?id=163&cid=14 https://blog.csdn.net/WYpersist/article...

2853 0 2

进击的小恶魔

大数据-hadoop报错调试路径001
启动hive报错：原因: 解决方案：出处：https://stackoverflow.com/questions/44469234/cannot-create-direc...

1140 0 0
进击的小恶魔

LCS
LCS(Longest Common Subsequence) 最长公共子序列一个序列S任意删除若干个字符得到的新序列T,则T叫做S的子序列两个序列X和Y的公共子序列中，...

591 0 0
进击的小恶魔

hive作业笔记
2.每个用户有多少个订单[orders] pv浏览量 > uv用户量 3.每个用户【2.平均【1.每个订单是多少商品】】 avg 每个用户在一周中的购买订单的分布 --列转...

1153 0 0
进击的小恶魔

hive 优化
数据倾斜万能的方法：hive.groupby.skewindata=true这个环境变量是用于控制负载均衡案例：双11的数据特别多，别的时间的任务很少，处理双11的redu...

586 0 0
进击的小恶魔

Kmeans笔记
训练过程中，没有标签，属于无监督学习。层次聚类有包含关系，非层次聚类没有包含关系举个例子：外部评价方法：有1亿篇文章没有划分类别，有1000篇已经划分好了类别，先对1亿篇...

959 0 0

进击的小恶魔

tensorflow的坑
安装tensorflow一直不成功，气死我了今天找到一篇文章，终于成功了 https://blog.csdn.net/k7arm/article/details/77799...

860 0 0
进击的小恶魔

hive
Hive 是一个SQL 解析引擎，将SQL语句转译成MR Job，然后再hadoop上运行，达到快速 mysql是存放数据的，而hive是不存放数据的，hive的表是纯逻辑表...

1781 1 1
进击的小恶魔

sklearn中cross_validation导入失败
from sklearn.cross_validation import train_test_split 导入报错：No module named 'sklearn.cro...

10216 0 0

个人介绍

路漫漫其修远