处在互联网高速发展的时代,我们的生活中、工作中无时无刻不在接触到数据。企业市场的决策、人体健康的预测、体育赛事的预测、环境检测的预测······越来越多的行业都把数据分析结果作为企业决策的基础。但是在大数据高速兴起的同时,我们也逐渐意识到,国内目前的数据分析人才还有很大的空缺,大到复杂的数据建模,小到简单的Excel 基础分析,都还有极大的缺口存在。
数据分析的一般过程有5个步骤:
1.数据采集;
2.数据预处理;
3.数据分析;
4.数据挖掘;
5.数据展现,报告撰写。
虽然数据分析完整的步骤较为繁杂,但是要想完成一个完整的数据分析过程,数据预处理这一步骤有着不可忽视的地位,任何数据分析之前都要对数据进行全面的预处理,否则可能会使得后面的工作功亏一篑。本文就是从EXCEL开始讲解快速入门数据分析。
.Excel 快速处理数据
当我们拿到数据之后,在Excel可以处理的情况下,可以对到手的数据进行大清理啦,在这里可以完成对数据的精度调整,重复数据的筛选,数据的匹配等一系列工作。
1.数据精度的调整
对于很多财务工作人员来说,对数据的精度有统一要求,那么这里可以应用的函数:
round(number,num_digits) 对数据四舍五入,num_digits指四舍五入之后的小数位数
roundup(number,num_digits) 向上舍入任意实数
rounddown(number,num_digits) 向下舍入任意实数
example :对于 数字 98.96 在单元格B1,
Round (B1,1)=98.9
Roundup(B1,1)=98.9
Rounddown(B1,1)=98.8
2.日期格式的调整
抽取的数据需要按时间分类需要用的数据函数
year ( serial_num) 提取给定日期的年
month( serial_num) 提取给定日期的月
day (serial_num) 提取给定日期的日
date ( year, month, day) 将不同的年月份组合成要求的日期
3.剔除数据空格
很多时候抽取出的数据本身存在空格,这种情况就要求我们事先对数据去空格后才能做下一步的处理,剔除空格需要用到的公式:
trim (text)
这里我们可以进一步引申出一个函数text ( value,form_text)
4.数字格式转换为文本格式
text (value,form_text)
根据指定的数值格式将数字转换为文本形式
这一函数需要牢记,在我们应用中会有很大的作用,我们在对数据进行匹配的时候,要保证数据是处于相同的格式,否则很有可能会匹配不到想要的结果。
5.数据的连接
在处理数据时,通常要确定关键词,那么这个时候就需要用到CONCATENATE(text1,text2,······)函数了,这个函数可以把我们需要用到的关键列组合在一起,起到and 的作用,同时还需要了解“ & ”这个符号也跟这个函数有异曲同工之用。相较之下,CONCATENATE 函数 用来连接数据更加简单、快捷。
6.数据的提取
前面我们说了连接数据需要用到的公式,那么同样我们也要学习怎样去拆分一个数据,在EXCEL 中,我们有3个公式可以用来拆分一个单元格的数据:
left (text,num_chars) text 是要提取的字符串数据,num-chars 是从左往右截取多少位字符;
right (text,num-chars)这里的num-chars 是指从右往左截取多少位字符;
mid(text,start_num,num-chars) start_num 是指从第几个字符串位置开始截取,num_chars 依然指的是截取的字符串位数。
7.逻辑函数
很多时候我们对取出的数据进行逻辑判断,这里就可以用到if 函数对数据进行判断。
if (logical_test,value_true, value_false)
logical_test 指的是用来判断的条件,value_true 是指条件正确是 TRUE,value_false 是条件错误时是False.
example:判断 下面左列数据是否大于3,若是,则用"Y" 表示,否则用“N"表示
使用逻辑函数判断,我们只需要根据"Y" 和 "N"就能轻易将一组数据进行分类。看完要牢记哦!
8.数据的四则运算
EXCEL 中经常会对数据进行四则运算,这里我们重点讲解加法运算,即sum( )和sumif( )函数的运算 。
sum( num1,num2,······),在空白单元格中输入=sum(),然后将要相加的单元格拖入到()中。
example:要计算AN列数据的和
输入公式后直接按下Enter键,就可以得到这组数据之和。
sumif( range,criteria,sum_range )对区域中符合指定条件的求和
range 是指条件区域,criteria是指需要满足的条件,sum_range 是需要求和的数据区域
example:需要对status 是APPROVED状态下的AN列数据求和,如下图
在AP2 单元格中输入公式 = sumif(AO1:AO7,"APPROVED",AN1;AN7),按下Enter键即可得到想要的结果。
9.英文字母的大小写变换
在数据处理的时候,有时候会对字母的大小写变换有一定的要求,这时需要用到的公式:
proper ( text) 除首字母外都转换成小写,ghjD在A1 单元格 proper(ghjd)=Ghjd
upper (text )所有字母都转换为大写,upper(A1)=GHJD
lower ( text) 所有字母都转换为小写,lower(A1)=ghjd
10.新旧数据字符串的替换
Replace(old_text,start_num,num_chars,new_text)
Replace(要替换的字符串,开始位置,替换个数,新的字符串)
example:要将qwer中的e 用E替换
按下Enter键之后就可以得到想要的结果qwEr.
以上是通过Excel 快速入门系列的第一次文章啦,熟练使用这10个公式对于很多新入门Excel 的人来说已经可以完成很多基本的数据处理了,接下来会对于Excel中更比较常见的函数进行讲解,比如Vlookup,match 啦,努力争取写完excel 还会接着写spss的处理数据方法。大家还有其他想看的留言哦!