5.2 优化insert语句 当进行数据的insert操作的时候,可以考虑采用以下几种优化方案。 如果需要同时对一张表插入很多行数据时,应该尽量使用多个值表的insert语句...
ETL是数据仓库里最重要的数据处理过程,也是最体现工作量的环节,一般会占到整个数据仓库项目工作量的一半以上。 ● 抽取:从数据源获取数据。 ● 转换:转换数据,使之转变为适用...
WHILE WHILE,当的意思。在SQL的语法中,通常可以用来重复执行某段SQL脚本。 通俗来说,就是当XXX时,执行某某操作,意为循环。 看到这里,小伙伴可能会有疑问,P...
BOSS:白茶,咱这个报表啊,每年一到一月份的时候,柱子和折线图都会变成一根柱子或者一个点,这样太难看了,能不能换个看法?白茶:老板,比如说呢?你想咋看?BOSS:这样吧,往...
1、Spark与Hadoop Hadoop 已经成了大数据技术的事实标准,Hadoop MapReduce 也非常适合于对大规模数据集合进行批处理操作,但是其本身还存在一些缺...
⾸先分库分表分为垂直和⽔平两个⽅式,⼀般来说我们拆分的顺序是先垂直后⽔平。 垂直分库 基于现在微服务拆分来说,都是已经做到了垂直分库了 垂直分表 如果表字段⽐较多,将不常⽤的...
第1章 数据仓库简介 1.1 什么是数据仓库 Inmon将数据仓库描述为一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。 1.3 数据仓库架...
评价一个商业产品好不好,我们可以使用NPS、退款率、产品的使用效果等指标。 NPS是推荐值,是用户向其他人推荐产品的可能性,净推荐值(NPS)=(推荐者数/总样本数)×100...
在有分页查询的应用中,包括 LIMIT 和 OFFSET 的查询十分常见,而且几乎每个都会有一个 ORDER BY 子句。如果使用索引排序的话将对性能优化十分有帮助,否则服务...
Python 读取数据自动写入 MySQL 数据库,这个需求在工作中是非常普遍的,主要涉及到 python 操作数据库,读写更新等,数据库可能是 mongodb、 es,他们...
数据分析工具类软件,大体可以分为以下5类: Excel生态工具、数理统计工具、BI工具、数据库工具、编程工具 (Excel单独分成一类,主要是因为它应用场景广泛,且用户基数过...