团队内部要分享HBase的知识,之前研究了一段时间,知识比较零散,这一次就系统化的整理一番,之后在想到Hbase的时候,看着一篇就够了。 阿里陶系技术部招人,目前大把机会,H...
团队内部要分享HBase的知识,之前研究了一段时间,知识比较零散,这一次就系统化的整理一番,之后在想到Hbase的时候,看着一篇就够了。 阿里陶系技术部招人,目前大把机会,H...
链接1[https://learnku.com/docs/python-guide/2018]链接2[https://pythonguidecn.readthedocs.io...
假设有字典列表: 要求price的最大值与最小值 最原始的方法: 刚学Python时会这么写... 先使用列表推导式(list comprehension), 再使用内置函数...
当当阅读器:http://e.dangdang.com/pc/reader/index.html?id=1901212551[http://e.dangdang.com/pc...
第 1 章 引言 第 2 章 分布式架构理论及典型实践 第 3 章 当前主流的 IT 架构分析 第 4 章 新一代银行 IT 架构分析 第 5 章 新一代银行 IT 架构实践...
第4章 Matplotlib数据可视化 Matplotlib 是建立在 NumPy 数组基础上的多平台数据可视化程序库,最初被设计用于完善 SciPy 的生态环境。John ...
小红书如何实现高效推荐[https://www.sohu.com/a/331433673_308467] flink入门-流式计算概念[https://zhuanlan.zh...
第一部分:机器学习基础 (解决简单问题)一、机器学习概览二、一个完整的机器学习项目三、分类四、训练模型五、支持向量机六、决策树七、集成学习和随机森林八、降维 第二部分:神经网...
第12章 元数据第13章 计算管理第14章 存储和成本管理第15章 数据质量第16章 数据应用 第12章 元数据 12.1 元数据概述 12.1.1 元数据定义 按照传统的定...
第8章 大数据领域建模综述第9章 数据整合及管理体系第10章 维度设计(重点!)第11章 事实表设计 第8章 大数据领域建模综述 8.1 为什么需要数据建模 随着DT时代互联...
第1章 总述第2章 日志采集第3章 数据同步第4章 离线数据开发第5章 实时技术第6章 数据服务第7章 数据挖掘 第1章 总述 2014年,马云提出,“人类正从IT时代走向D...
百度百科[https://baike.baidu.com/item/%E7%BB%B4%E5%BA%A6%E5%BB%BA%E6%A8%A1/3676887?fr=aladd...
Hive调优集锦[https://blog.csdn.net/zhanglong_4444/article/details/117264381]Hive/HiveSQL常用优...
第5章 数据读取与保存 本章对于工程师和数据科学家都较为实用。工程师会了解到更多的输出格式,有利于找到非常适合用于下游处理程序的格式。数据科学家则可能更关心数据的现有的组织形...
推荐序译者序序前言第1章 Spark数据分析导论第2章 Spark下载与入门第3章 RDD基础第4章 键值对操作第5章 数据读取与存储第6章 Spark编程进阶第7章 在集群...
什么是机器学习 机器学习在许多方面都可以看作是数据科学能力延伸的主要手段。机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既没有高效的理论...
Python 数据类型 Python 的用户往往被其易用性所吸引,其中一个易用之处就在于动态输入。静态类型的语言(如 C 或 Java)往往需要明确地声明每一个变量的数据类型...
NumPy 和它的 ndarray 对象,为 Python 多维数组提供了高效的存储和处理方法。Pandas 是在 NumPy 基础上建立的新程序库,提供了一种高效的 Dat...