如何认识数据
S1:打开数据
首先,打开stata,你会看到这样的一个界面。
面对全英文的界面,需要知道每一块位置代表着什么,方便以后的操作。
中下"Command"(命令窗口):你可以在此窗口输入想要执行的stata命令。
左上"Review"(历史窗口):自动记录stata自启动以来执行过的所有命令。
中上"Results"(结果窗口):显示执行stata命令以后的输出结果。
右上"Variables"(变量窗口):显示stata当前数据的所有变量。
右下"Properties"(性质窗口):显示当前数据文件与变量的性质。
知道命令该如何输入以后,那么问题来了,数据怎么导入Stata呢?其实也很简单。
Method1:只需要你找的需要打开的数据文件,右键打开方式选择Stata即可。(前提是你已经正确安装好了Stata哈)
当然还有别的教科书般的做法,但是我认为直接找到数据再打开的方式是最简单的。这里也顺便介绍一下。
Method2:打开Stata软件以后,点击Data Editor图标(看上去是一个表格上面有只笔,排在所有图标的倒数第五个),然后用Excel打开目标表格,将所有数据复制,然后粘贴到刚刚打开的Data Editor中。此时Stata会询问“第一行是数据还是变量名”,根据实际情况选择即可。
Method3:点击菜单"File"---"Import",然后导入各种格式的数据。
好的,我就按照上面的Method1打开了一个数据。
S2:描述数据
stata提供了一系列命令帮助我们快速简单了解数据,最主要的有describe, list,summarize,tabulate等,下面介绍它们的使用方法。
describe:显示数据的变量名单和标签等信息。可简写为des或者d
代码:
des
list:列出目标变量的具体数据
代码:
list lnw s in 1/10
解释:lnw和s是我打开的数据中的两个变量,in 1/10表示显示1值10行的lnw和s的值。
summarize和tabulate的使用方法也是一样,按照stata语言规定的格式输入即可,此处不再赘述。
不会的可以输入以下命令行,查看标准手册进行使用。
help summarize
手册是自学的最好老师,一定要合理运用。
通过S1和S2就可以对Stata和数据有初步的了解了,想要更加深入了解数据,作图是很好的选择。
S3:绘制图像
通过理论分析,往往可以知道数据的因变量是谁,自变量可能比较复杂,为了大致知道自变量和因变量是否存在相关关系,就需要用到作图法了。
输入命令:
scatter lnw s
scatter代表散点图,适用于观察两个变量之间是否存在相关关系。
还有很多图会经常用到,具体可以输入命令help twoway(双向图)
查询到。这里也简单罗列了一些:
- scatter ——scatterplot
- line —— line plot
- connected ——connected-line plot
- scatteri —— scatter with immediate arguments
- area ——line plot with shading
- bar —— bar plot
- spike ——spike plot
- dropline —— dropline plot
- dot —— dot plot
学习到这里,相信你已经对Stata有了初步的掌握,如果有任何问题欢迎留言一起探讨。