身处于高速发展时代下的我们,会有这样一种感觉:对于知识的学习,不再仅仅只局限于学校时所习得的专业知识,毕业后也不代表就不用再学习,相反唯有不断学习才能让自己保持进步。 这是一...
IP属地:北京
身处于高速发展时代下的我们,会有这样一种感觉:对于知识的学习,不再仅仅只局限于学校时所习得的专业知识,毕业后也不代表就不用再学习,相反唯有不断学习才能让自己保持进步。 这是一...
1. 版本兼容 Hive on Spark仅使用特定版本的Spark进行测试,因此只能确保给定版本的Hive与特定版本的Spark一起使用。其他版本的Spark可能与给定版本...
1、背景 Hive是目前大数据领域,事实上的SQL标准。其底层默认是基于MapReduce实现的,但是由于MapReduce速度实在比较慢,因此这几年,陆续出来了新的SQL查...
一.Cookie 1.什么是cookie? Cookie 技术产生源于 HTTP 协议在互联网上的急速发展。随着互联网时代的策马奔腾,带宽等限制不存在了,人们需要更复杂的互联...
4月8日晚,DTalk邀请到了郑栋老师,他是网易互联网分析产品、可视化 BI 产品负责人,进行了一次关于《网易郑栋:数据采集与分析的那些事第一弹: 数据篇》的微信群线上主题分...
本文是酷狗音乐的架构师王劲对酷狗大数据架构重构的总结。酷狗音乐的大数据架构本身很经典,而这篇讲解了对原来的架构上进行重构的工作内容,总共分为重构的原因、新一代的大数据技术架构...
kafa 吞吐量高的原因 顺序读写 kafka的消息是不断追加到文件中的,这个特性使kafka可以充分利用磁盘的顺序读写性能 顺序读写不需要硬盘磁头的寻道时间,只需很少的扇区...