1、stata基本操作袁宏斌Review:历史窗口,记录自启动stata以来执行过的命令Command:命令窗口,在这里输入要执行的命令。Results:结果窗口,显示执行命令后的输出结果Variables:变量窗口,记录目前stata内存中的所有变量Properties:性质窗口,显示当前数据文件和变量的性质1.操作界面2.数据导入 data - data editor - data editor(edit) (或者倒数第五个图标) 将Excel表格中的数据粘贴到data editor中。 提示窗口中选择Variable names(第一行的是变量的名称,而不是具体数值)3.编辑变量的标签(la
2、bel) Data - Variables Manager 或者 倒数第三个图标 修改label: TC 改为 total cost Q 改为 total output PL 改为 price of labor PF 改为 price of fuel PK 改为 user cost of capital 点击 Apply 完成修改4.1 审视数据:展示数据集 Describe 展示数据集的信息 方法:输入 describe 或者 d4.2 审视数据:展示具体变量 list 展示具体变量的数据 方法:list variable(此处为变量名称) 输入 :list tc q 展示 tc 和 q 的
3、数据5.1 展示部分数据:基于位置 例:查看tc变量前5个数据,输入list tc in 1/5查看tc中第1320个数据,输入list tc in 13/20查看 tc 和 q 中第2228个数据,输入 list tc q in 22/28结果窗口显示:5.2 展示部分数据:基于逻辑关系 展示满足q=10000的q的数据 方法:list q if q =10000 展示满足q=10000的q和tc的数据 方法:list q tc if q =100006.1查看变量的统计特征 查看变量q的统计特征: 方法:输入summarize q 或 su q 展示变量q的样本容量,平均值,标准差,最小值
4、,最大值6.2查看变量的统计特征 如果要查看满足q10000的子样本的统计指标。方法:输入summarize q if q =10000 或者su q if q =100006.3 查看变量的统计特征 如果要查看更多的统计指标 方法:输入 su q,detail 显示了百分位数,方差,偏度与峰度6.4 查看变量的统计特征 如果summarize 后面不输入具体变量,则展示所有变量的统计指标 方法:输入summarize 或 su7.经验累积分布函数 如果要查看q的经验累积分布函数 方法:tabulate q 或则 ta q8.相关系数 如果要显示PL,PF两个变量的相关系数 方法:pwcorr
5、 pl pf 如果要显示PL,PF,PK三个变量之间的相关系数 方法:pwcorr pl pf pk8.1 相关系数 如果要显示PL,PF,PK三个变量之间的相关系数,并显示显著性水平 方法:pwcorr pl pf pk,sig star(.05)9.画图:直方图 如果要做出q的直方图,宽度为1000 方法:histogram q,width(1000) frequence9.2画图:经验分布图 如果要画变量 q的经验分布图(折线图) 方法:kdensity q9.3 画图:散点图 如果要画散点图(两个变量) 方法:scatter tc q 问题:无法知道每个点对应于哪个观测值9.3.1 散
6、点图改进 定义新变量值n来表示第n个观测值: 方法:gen n=_n (_n表示第n个观测值) 使散点图显示对应的观测值: 方法:scatter tc q,mlabel(n) mlabpos(6)9.3.2 散点图上做回归线 在散点图上做回归线 方法:输入twoway(scatter tc q)(lfit tc q) 保存该图:输入graph save scatter19.3.3 散点图上画二次回归曲线 在散点图上画出二次回归曲线 方法:输入twoway(scatter tc q)(qfit tc q) 保存该图:输入graph save scatter29.6 图像合并展示 将线性拟合和二次拟合这两个图像在一起展示 方法:输入graph combine scatter1.gph scatter2.gph