今天来给大家介绍三个我在学习 Python 路上帮助比较大的堪称神级的网站,尤其是对于刚刚入门的同学来说,绝对不容错过~ pythontutor 这个网站对于新手同学理解代码...
今天来给大家介绍三个我在学习 Python 路上帮助比较大的堪称神级的网站,尤其是对于刚刚入门的同学来说,绝对不容错过~ pythontutor 这个网站对于新手同学理解代码...
原创:微信公众号 码农参上,欢迎分享,转载请保留出处。 Guava是google公司开发的一款Java类库扩展工具包,内含了丰富的API,涵盖了集合、缓存、并发、I/O等多个...
简介 TCP是一种面向连接的、可靠的、基于字节流的传输层通信协议,在发送数据前,通信双方必须在彼此间建立一条连接。所谓的“连接”,其实是客户端和服务端保存的一份关于对方的信息...
如果你在学Python数据处理,一定对CSV文件不陌生。日常本地数据存储中,除了Excel文件外,大部分数据都是以CSV文件格式保存的。 CSV(Comma-Separate...
data_hour=2022033100 data_hour_next=2022033101 day_id=${data_hour:0:8} day_id_next=${da...
1.8 HashMap HashMap主要是数组+单链表+红黑树组成。其实就是在一定条件下,数组index下的单链表转化成红黑树,这是提升查找效率的。 原来jdk1.7的优点...
Hive 中 sql 语句的执行顺序如下: from .. where .. join .. on .. select .. group by .. select .. ha...
1. 老版本:xls 使用的相关模块:xlrd、xlwt、xlutils。因为老版本的excel的操作是将读、写、修改分开的,其中xlrd用于读、xlwt用于写、xlutil...
当有项目需求用到正则表达式,你会怎么做?打开百度直接搜索「手机号正则表达式」,复制到 IDE 运行一下看一看符不符合自己的期望? 是不是常常因为找不到合适的表达式,深恶痛绝。...
列裁剪和分区裁剪 最基本的操作。所谓列裁剪就是在查询时只读取需要的列,分区裁剪就是只读取需要的分区。当列很多或者数据量很大时,如果select *或者不指定分区,全列扫描和全...
在企业中使用Hive构建离线数仓是一种十分普遍的方案。尽管Hive的使用场景是通过批处理的方式处理大数据,通常对处理时间不敏感。但是在资源有限的情况下,我们需要关注Hive的...
本文将介绍Hive调优的整体过程,以及本人对Hive调优过程的一些思考,包括Hive调优的一般步骤,和调优方法。 1,Hive一般优化方法 1,查看HiveSQL执行计划 H...
1 数据倾斜 绝大部分任务都很快完成,只有一个或者少数几个任务执行的很慢甚至最终执行失败,这样的现象为数据倾斜现象。 将数据倾斜分为单表携带了 GroupBy 字段的查询和两...