1. 前言
在目前工作中,用stata清洗及分析数据,感觉很顺滑。无奈不少同学因为help文件里的英文望而却步。
带着学习和分享的目的,根据工作经验,给大家整理一些常用以及不太常用但很有用的命令,并对该命令的help文件进行有侧重的详解。
2. 命令及获取
gsort
:顺序和倒序排序,系统自带命令
3. 描述
gsort
:与sort
只能进行顺序排序不同,gsort
可以同时进行多个变量之间的顺序和倒序排序结合。
4. 语法
*varname可以是数值或字符串;变量名前不加或者加+表示顺序;变量名前加-表示该变量进行倒序
gsort [+|-] varname [[+|-] varname ...] [, generate(newvar) mfirst]
- [,]:中括号里的为额外选项命令,按需求添加,而添加选项记得加英文逗号,
5. 选项
generate(newvar)
:添加该选项,生成新变量,变量内容为1,2,3,……的顺序数。mfirst
:添加该选项,降序排序时将缺失值放在最前面而不是默认的最后面。
6. 举例
*调用系统数据bp3
webuse bp3
*显示变量id,time,bp,且前10个个案
l id time bp in 1/10
*先对变量id顺序,再对变量time进行倒序排序
gsort id -time
*显示变量id,time,bp,且前10个个案
l id time bp in 1/10
*先对变量id倒序,再对变量time进行顺序排序,并生成新的变量num
gsort -id time,g(num)
*显示变量id,time,num,且前20个个案
l id time num in 1/20
*调用系统数据auto
sysuse auto,clear
*先对变量rep78倒序,再对变量make进行顺序排序
gsort -rep78 make
*显示变量make,rep78,且倒数10个个案
l make rep78 in -10/-1
*先对变量rep78倒序,再对变量make进行顺序排序,且缺失值排在最前面
gsort -rep78 make,mfirst
*显示变量make,rep78,且前10个个案
l make rep78 in 1/10
7. 菜单
Data > Sort