我们很多同学有这种感觉,就是学了好多课程,或是看了好多的书后,遇到问题还是不会。
就像我们学PS,最开始就学怎样设个漂亮的字体,甚至那时候卖的书副本者是怎样制作各种字体。还有像使用抠图,我们学会了各种抠图的技巧,但是真正遇到实际的例子时还是不会。所以很多同学觉得excel特别难,不是说excel的功能难,或者是excel的界面上那些功能能,而是当他录入了一些数据,或者是建立了一张表格后,当他再次对这些数据进一步的处理时,就无从下手。你没有办法对这张表进行计算,没有办法进一步提取数据。或者是如果要实现上级或是领导的二次修改时要再一次重新对数据进行计算。这才是问题所在。之所以会出现这些问题,就是因为我们一开始就没有遵守数据的使用原则。所以才造成后面遇到的问题。
excel只是个工具,而数据才是我们要面对的,就像高手过招,你会各种功法没用,最重要的是要了解你的敌人。否则你将来肯定会遇到菜鸟乱拳打死老师傅的那天,而那个”老师傅“就是你!由于我们的计算机并没有那么智能,所以这些原则其实都是给计算机定的,我们要想使用好数据,就必须遵循计算机处理数据的方式,按他的方式处理数据。
我列出了下面几条excel中要遵守的原则,这个同样也是数据库要遵守的原则,而你可以把excel理解为一个简化了的数据库。看一下吧!
1、数据的独立性。即字段要求只存储一类数据,比如我们下而这张表展示的,我们的GDP的数据,我们不能把不同年份的GDP存储在不同的列中。而是要存储在一列中。如果你以这样的方式存储,那你要再次对这些数据进行处理就特别困难。
正确表格
其实我们的第一张表格叫“透视表”,但很多人真接为了看着方便,直接就这样存储数据了。但但大家也不用担心啊,excel中其实现在有个功能可以一下子把第一张图转换为第二张图,那就是excel的“逆透视表"的操作。
2、数据的最小化原则。即数据存储要以最小单元进行划分。比如,我们的地址,经常是省、市、县、区、镇、村都放在一个单元格里,这样我们如果要把这些数据后其分开其实是很困难的,要使用大量公式,进行多种情况的判断,这个复杂程度看你的数据复杂程度。
3、数据的唯一性,就是说我们要添加一个唯一字段,你可以添加 一个序列列。也可以包含一个唯一值字段,这样我们就唯一的标识了我们的数据,由其是你在”表“中经过多次排序后,如果他有表外的动态引用进,很容易出错。所以加了唯一列不仅可以在多张表中进行匹配时有用,更能够恢复数据。
4、数据类型的正确。类型正确就是设置一个正确的格式。比如日期,你如果设置为数字 ,他就是一个数字。你如果不通过列标题,你是没办法知道他是一个日期的。时间也一样。
5、存储与显示的分离。就是永远不要动原表。一定要备份。你要做什么操作,一定要复制一份。
有了上面的基础后,你才可以更顺利的处理数据。
excel更新很快,现在已经是365在线版本了,他的2019版是最后一个离线的版本。所以你要想学最后的功能 就要更新到更新的版本。新版本支持更多的函数。像365中的版本就包含了”动态数据“的概念,他里面包含了一些函数,如unique();filter();sort()等函数。使用这些函数我们就不用再用以前复杂的公式去实现了,我们用这一个函数就得到以前只能使用”数组“公式才能实现的功能。
那么上面我们介绍了excel中对数据的要求。接下来遵守了数据的规则后,就可以使用函数和公式对数据进行处理了,你要学习函数对数据进行筛选、排错、合并、整理等。
使用公式和函数对数据整理后,我们就可以使用Excel的商业智能解决方案了,他完全可以和微软的BI相媲美。
首先就是excel数据模型。它是内存中的一块区域,他不在excel表中存储数据,而是把数据放在了内存中。这样做就是为了提高excel的数据存储能力,应对大数据的时代需求。比如 excel2007后大约支持16000多列、支持140万行。但在excel数据模型中,它可以支持19亿列、19亿行,这还不包含计算列在内。
学习了excel数据模型后,就可以使用excel POWER系列工具了。这是一夽组合拳。如使用power query调取外部数据,整合外部数据。他可以合并多张表单,多个工作本。他可以连接数据库,可以导入json文件等等。他支持一种叫"M语言"的东西,甚至可以抓取网络上的数据。
用power query 获取到数据后,就可以使用power pivot对数据进行分析 ,你可以使用power pivot 生成各种透视表,如我们第一张图其实就是透视图,如果老板让你改数据的话,你完全不用动原始数据,直接修改power pivot就可以了,非常方便,也保证了数据的一致性,不容易出错。
在power pivot 里面你可以定制计算列,生成你想要的计算后的字段,还可以使用度量值对数据进行整体分析 ,使用KPI指标加强分类显示。可以建立不同数据源间多张表间的关系。就像数据库中使用外键对不同表建立关系一样。而他做的是可以在不两只数据库间的表建立关系。
在power pivot里我们对计算列和计算度量值都是使用一个叫DAX的数据分析语言对数据进行处理,它可以处理单列,也可以在多长表中进行数据的处理计算,它是一种函数语言,所以它的使用方式和我们的普通函数非常相似,他和数据库分析语言T-SQL非常像,可以实现T-SQL的所有功能,但在学起来却比sql这种脚本语言要容易的多。
对数据进行分析后,我们就可以生成一个图表对他进行展示 了。这时我们可以使用两使用方式。第一种就是使用”透视图“。第二种就是使用power view。他们之间没有什么区别,看各自的喜好,只不是两边支持的图表类型可能不太相同,大家只要选择适合自已的就行。
对于数据的展示,你还可以使用地图进行展示 ,在power view ,透视图、三维地图里,都支持地图显示功能 。由其是3D map支持动态显示的功能 ,你可以依据时间字段,生成视频文件,最后可以导出生成的视频 文件在power point里进行展示 。还有你可以使用边界文件对数据进行展示。因为直接使用地图里的数据,他只支持区一级的边界显示,但你可以使用一个自已的shp文件,实现一个自定义区域数据的展示。
那么,以上就是我自已的一点心得,希望对你有用,如果你感兴趣这些内容,关注微信公众号,获取更多免费内容:搜索”跟码农学Excel"或公众号:excel_gulu