1. 前言
在目前工作中,用stata清洗及分析数据,感觉很顺滑。无奈不少同学因为help文件里的英文望而却步。
带着学习和分享的目的,根据工作经验,给大家整理一些常用以及不太常用但很有用的命令,并对该命令的help文件进行有侧重的详解。
2. 命令及获取
expand
:复制个案数,系统自带命令
3. 描述
expand
:复制数据集中个案数n份,其中,n为四舍五入到最接近表达式结果的整数,如果表达式结果小于1或者为缺失,则n为1,即不进行原数据的复制。
4. 语法
expand [=]exp [if] [in] [, generate(newvar)]
- [,]:中括号里的为额外选项命令,按需求添加,而添加选项记得加英文逗号,
- [if]:表示增加条件,例如,变量var等于1,
if var==1
。- [in]:表示选择个案数,例如,选择前10个个案,
in 1/10
。
5. 选项
generate(newvar)
:添加该选项,可新生成名为newvar的变量,用于标记原始数据(newvar等于0)和复制后的数据(newvar等于1)。这样的话,若要还原原始数据,则只需要通过保留newvar等于0的数据来实现,即keep if newvar==0
.
6. 举例
*调入数据stackxmpl
webuse stackxmpl
*显示数据
list
*将原始数据复制1份,即2倍的原始数据量
expand 2
*显示数据
list
*调入数据stackxmpl,并清除现有内存数据
webuse stackxmpl, clear
*显示数据
list
*将每条个案复制为原始个案数的x份,其中x是该个案数的b值
expand b
*显示数据
list
7. 菜单
Data > Create or change data > Other variable-transformation commands >Duplicate observations
8. 存储的结果
无
9. 补充
无