1、.1宋顺林中央财经大学 会计学院.2内容提纲n1.1导入数据n1.2编辑数据n1.3描述数据n1.4结果和程序管理n1.5多表数据管理.31.1 导入数据打开Stata软件STATA由四个窗口构成Review (列出历史命令)Variables (变量列表)Results (报告结果)Command (输入命令)你可以通过下列菜单调整窗口设置Edit/preferencesWindow/command, variables .4display 命令在命令窗口输入:display 1display song 试试以下两者的区别:display 1+1 display 1+1.5Help 命令菜单
2、窗口help/pdf document (Stata基本参考手册)help/content (Stata所有命令 介绍)help/stata command (搜索查询Stata命令)命令窗口help + stata 命令,例如:help displayhelp help 另外,你也可以利用search命令寻求帮助,例如:search displaysearch help .6Insheet:导入数据通常数据来源于数据库下载,而不是手工录入导入格式Stata不能直接支持很多格式(Excel files, SAS files)可以先保存为csv格式后再导入stata准备工作:将Excel文件另存
3、为csv格式,然后导入 csv文件。菜单窗口File/import/ASCII data created by spreadsheet /browse file name 命令窗口insheet using D:Teach课件STATAdatacorgov.csv ,clear在知道文件路径的情况下,往往使用insheet命令更为方便对insheet了解更多, pls help insheet.7drop _all and clear首先导入数据insheet using D:Teach课件STATAdatacorgov.csv ,clear然后试试以下两个的差别:insheet using
4、D:Teach课件STATAdatacorgov.csv insheet using D:Teach课件STATAdatacorgov.csv ,clear为什么要加clear,原因是:你必须先清除(clear)原来的数据,才能导入新的数据你也可以先用drop _all 删除原有数据,然后导入新的数据.8检查数据describe ,list,browse,edit 导入数据之后,你可以检查一下数据是否导入成功,有好几种方式可以帮到你:在命令窗口输入describe 或 d ,将显示样本、变量数、数据大小及变量的详细信息。输入入list, 显示所有样本数据,试试以下命令:list in 1 li
5、st in 2/10输入browse 或br, 在数据窗口浏览所有数据输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数据试试browse,list,edit三个命令,看看三者的区别注意:上述命令也可以通过菜单的方式实现。.9保存数据菜单窗口File/save File/save as(另存为)命令窗口save D:Teach课件STATAdatacorgov.dta save D:Teach课件STATAdatacorgov.dta ,replace replace的作用是,如果文件已存在,则替换注意stata格式文件的后缀为.dta.10练习1.1导入表名为earning的Exc
6、el格式数据检查数据保存数据为stata数据格式.111.2编辑数据打开stata数据use D:Teach课件STATAdatacorgov.dta,cleardrop命令,删除变量或观察值drop if year=2010,删除所有2010年的变量drop year,删除year这个变量drop _all,删除所有变量注意:stata值的等号全为双等号,单等号是赋值命令,在以后的操作中,注意=号和=号的区别。 .12打开stata数据use D:Teach课件STATAdatacorgov.dta,clearkeep命令是drop命令的反向命令keep year topone,删除其它变量
7、,只保留year和topone这两个变量keep if year=2010,删除其它年度变量,只保留2010年的变量rename,编辑变量名称rename topone top1label ,为变量名贴标签,以更容易理解label var top1 第一大股东持股比例clear,清空所有数据.13练习1.打开stata数据删除privateprivate变量只保留stkcd year两个变量删除2008年的数据只保留2010年的数据将year变量改名为y将y的标签设置为年度.141.3描述数据count,看看有多少样本count count if year=2008summary or sum
8、,描述样本的统计量sum topone ,描述topone变量最基本统计量,均值、方差、最小值、最大值sum topone, d,描述topone变量更为详细的统计量,包括偏度、峰度、分位数。tabulate或tab,描述离散变量的基本统计量tab private,描述private变量为0和1的百分比 .15练习1.3用stata打开corgov文件看看一共有多少家样本看看2010年一共有多少家样本看看roa变量均值、方差、最小值、最大值是多少看看roa变量的5,75的分位数是多少,偏度是多少看看2010年private等于的比例是多少.161.4结果和程序管理log命令,你可以用log存储
9、命令和结果use D:Teach课件STATAdatacorgov.dta,clear打开log文件:capture log using “D:Teach课件STATAdataoutput.log”,replacesum toponesum topone,dtab private查看log文件:view “D:Teach课件STATAdataoutput.log”关闭log文件:log close查查capture有什么功能,help capture注意:log命令的功能同样可以通过菜单方式实现.17用doedit和do命令管理程序步骤用doedit打开程序管理窗口编辑程序,保存程序,运行程序
10、例子use D:Teach课件STATAdatacorgov.dta,clear打开程序:doedit输入一系列命令:sum toponesum topone,dtab private保存程序运行程序:do D:Teach课件STATAdatado.do思考doedit和do的用处?.18练习1.4建立一个log文件执行一些操作用log文件存储你的操作结果建立一个程序文件(do file)执行一些操作用do命令运行你的程序文件.191.3 多组数据处理整理数据过程中,我们经常会遇到两种情况我们希望在2000年的数据表后面加上2001年相同变量的样本数据-加行我们希望在原始数据基础上增加对样本公
11、司的其他特征的变量-添列1.3 多组数据处理NameyearSizeA2000B2000nameYearsizeA2000B2000nameyearsizeA2000B2000A2001B2001nameyearsizeA2000B2000nameyearindustryA2000B2000nameyearsizeindustryA2000B2000Master dataUsing data.201.5多表数据管理append 命令:数据表之间纵向合并,追加数据insheet using D:Teach课件STATAdatacorgov99-00.csv ,clearsave D:Teach课
12、件STATAdatacorgov99-00.dta ,replaceinsheet using D:Teach课件STATAdatacorgov01-10.csv ,clearappend using D:Teach课件STATAdatacorgov99-00.dta save D:Teach课件STATAdatacorgov99-10.dta,replacebr.21merge命令 数据表之间横向合并,追加新的变量insheet using D:Teach课件STATAdatacorgov.csv,clearsort stkcd yearsave D:Teach课件STATAdatacorg
13、ov.dta,replaceinsheet using D:Teach课件STATAdataearning.csv,clearsort stkcd yearmerge stkcd year stkcd year using D:Teach课件STATAdatacorgov.dta tab _merge(数值为1表示表一有,表二没有;2表示表二有表一没有;3表示都有)browsesave D:Teach课件STATAdatacorfin.dta,replacebrhelp _merge.22注意append命令和merge命令区别思考merge和append命令相对于excel直接copy的优势
14、使用merge命令时,经常容易出错,merge完后,一定要检验数据是否正确,可以用browse,也可以tab _merge。常见错误包括:忘记sort一下数据,合并不成功忘记添加关键词,导致合并的数据错误stata的merge功能非常强,可以1:1, 1:m,m:m详情请help merge.23练习1.5合并corgov99-00和corgov01-10两张表合并corgov和earning两张表思考合并 追加命令有何用处?.24课后练习复习练习1.1-练习1.5的内容!看一看stata的菜单里有些什么选项?想一想stata的窗口各有些什么功能?浏览一下stata的帮助里那些内容?浏览一下stata的手册里有那些内容?