统计学-经管类课件.ppt_163文库

资源描述

1、统计学的基本任务是收集、统计学的基本任务是收集、分析、表述和解释数据。分析、表述和解释数据。用用SPSSSPSS统计软件进行统计统计软件进行统计描述和计算，是目前较为有描述和计算，是目前较为有效便捷的方法之一。效便捷的方法之一。主讲人主讲人王淑芬王淑芬mail: mail: 密码：密码：1234567812345678办公地址：汉学院一楼办公地址：汉学院一楼教材教材统计统计学学贾俊平，何晓群，金勇进编著贾俊平，何晓群，金勇进编著中国人民大学出版社中国人民大学出版社 2006.6参考教材参考教材 SPSS统计分析方法及应用统计分析方法及应用薛微编著薛微编著电子工业出版社电子工业出版

2、社 2004.9 教学要求：教学要求：总学时：，其中，讲课：上机：作业要求：作业要求：（）书后作业（）次大作业（自编案例，撰写论文，交电子档）学习要求学习要求：课堂保持安静按时交作业不允许旷课、迟到、早退成绩要求：成绩要求：平时占30%（大作业0%，上机，上课及平时作业10%），期末占70%（闭卷笔试）第一章统计学与数据收集第一章统计学与数据收集第二章第二章基本统计分析基本统计分析第三章第三章SPSSSPSS的简单应用的简单应用第四章第四章第五章第五章假设检验假设检验第六章第六章方差分析方差分析第七章第七章回归分析回归分析第八章时间序列分析第八章时间序列分析目目录录第一章统计

3、学与数据收集第一章统计学与数据收集1.1统计分析的基本原理与内容统计分析的基本原理与内容1.2统计数据的类型统计数据的类型1.3统计数据的收集统计数据的收集1.1统计分析的基本原理与内容统计分析的基本原理与内容一.统计学的定义统计学是关于数据的科学，其内容包括数据的收集、分类、汇总、组织、分析、推断和解释。二.总体、个体、样本与统计量u总体：研究对象的全部数据组成的集合，记为X 。u个体：组成总体的每个基本单元。u样本：从总体X中随机抽取n个个体(X1 , X2 , , Xn ), n 为样本容量.u观测值：样本的一组固定数值，记为(x1 , x2 , , xn)。u统计量：样本(X1 , X

4、2 , , Xn)的不含任何未知参数的函数 g(X1 , X2 , , Xn). 三.描述统计学与统计推断学.描述统计学：研究一组数据的组织、整理和描述的统计学分支。l统计描述方法图示法：借助于各种图形描述总体或样本所具有的特征。定量方法：通过定义和计算一些反映总体的总量指标、平均指标和变异性指标，描述和把握研究对象的数量特征。.统计推断学：研究利用样本数据对总体的数量特征进行推断的统计学分支。l统计推断方法：抽样分布理论、参数估计、假设检验、方差分析、回归分析等。总体：用新灯丝生产的所有灯泡的寿命，平均寿命未知个新灯丝制成的灯泡样本平均值数据用于对总体平均数进行估计个用新灯丝制成的灯泡的平均

5、寿命为小时图统计推断过程四.统计分析过程基于统计或实际观察提出假设（问题）概念的可操作型定义抽取样本或受试者调查实验设计数据收集数据整理编制图表、统计描述解释数据是总体或样本结果发现，对总体进行分析、总结统计推断总体样本1.21.2统计统计数据数据的的类型类型统计数据的类型按计量尺度按收集方法按时间状况分类数据顺序数据数值型数据观测数据实验数据截面数据序时数据一.分类数据、顺序数据、数值型数据.分类数据（ Categorical data)v对事物进行分类的结果v数据表现为类别，用文字表述v对事物应进行平行的分类v各类别可以指定数字代码表示v分类数据举例：性别，学历，地区等性别：男-1，女-0

6、2.顺序数据(Rank data)v对事物进行分类的结果，但类别有顺序v比分类尺度精确v未测量出类别之间的准确差值v顺序数据举例：考试成绩、消费者对产品的偏爱程度等考试成绩：优-5、良-4、中-3、及格-2、不及格-13.数值型数据（Metric data)v使用自然或度量衡单位对事物进行计量的结果v结果表现为具体数值v是最常见的数据类型v数值型数据举例：温度，对产品质量的评价分等v温度=450C三种类型数据的比较v分类数据和顺序数据：说明的是事物的品质特征，用文字表示-定性数据或品质数据v数值型数据：说明的是现象的数量特征，用数值表示-定量数据或数量数据v定性数据和定量数据也可以相互转化如年

7、龄：老年、中年、青年、儿童学历：大学-1、高中-2、初中-3、小学-4二.观测数据和实验数据1.观测数据（observational data)通过调查或观测而收集到的数据社会经济领域2.实验数据（experimental data)在实验中控制实验对象而收集到的数据自然科学领域三.截面数据和时间序列数据1.截面数据（cross-sectional data)在相同或近似相同的时间点上收集的数据如2005年我国各地区的GDP数据2.时间序列数据（time series data)在不同时间上收集的数据如1996-2005年我国的GDP数据1.3统计数据的收集一获得数据的调查方法与问卷设计

8、1.统计调查方法统计调查普查抽样调查统计报表重点调查典型调查（1）普查v为特定目的经常组织的非经常性全面调查。（2）抽样调查v从总体中随机抽取一部分（样本）进行调查。（3）统计报表v按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供统计数据。（4）重点调查和典型调查v重点调查从调查对象的全部单位中选择少数重点单位进行调查。v典型调查从调查对象的全部单位中选择少数典型单位进行调查。2.问卷设计（1）问卷问题的产生v依据研究的目标，确定需要收集哪些数据，从而需要设置哪些问题。v依据对变量（特征）之间的相互关系的猜想来设立问卷问题。v依据数据处理方法来设立问卷问题。（2）问卷问题设立的

9、关键设置在问卷中的问题，必须是能够获得诚实的回答。v凡是不能获得诚实回答的问题，都不应当设置在问卷中。v对“怀疑得不到诚实回答”的问题，应当在不同位置，设置相同、相近、相反的问题，以求相互认证。（3）问卷问题写法的几个关键v对单选问题，备选答案应当是一个空间的完整划分。v对单选问题，备选答案不应当是两个空间（层面）的混淆。v但对于多选题，备选答案可以交叉。v无论对多选题还是单选题，任何一个备选答案都不能有多重含义。v无论对多选题还是单选题，备选答案之间不能有包含关系。v问题设计的用词要准确。v问题设计的用语要含义明确。v问题的不同提法，可能导致不同的回答结果。（4）对于得不到诚实回答而又必须

10、了解的数据的处理办法v变换问题的问法，从而获得相应的数据。v通过了解相对数据，判断总体的情况。v通过实验获得所需要的数据。（5）问卷设计一定要通过小规模访谈来修改。二.问卷调查表的编码(一）单选题问卷调查表的编码1.题号代号不能重复，变量名称最好以英文字母为开头，字母大小写均可。如A1,A2;B1,B2。2.同一量表的题号最好有相同的识别码。如表1都用a1,a2;表2都用b1,b2。3.名义或类别变量的变量代码最好与其意义内涵有关。如年龄为AGE，年级为YEAR，工作类别为JOB等。4.变量代码不要用中文字，如要加注部分变量的中文说明，可于SPSS操作中修改。见房地产问卷设计（二）复选题问卷调

11、查表的编码问卷调查表您的性别：1男生 2女生您的职务：1主任 2组长 3教师一.您认为目前教改阻力来自哪些单位？（可复选）1教育行政单位 2学校行政人员 3家长团体4教师本身 5其他团体二.您认为目前教改对哪些人会有影响？（可复选）1教师 2行政人员 3学生 4其他NUMsexjobA11 A12 A13 A14 A15 A21 A22 A23 A24001 11101101101002 12001111000 变量编码表NUM-编码Sex-性别 job-职务单选A11-A15代表第一题5个选项，选中者输入1，未选中者输入0三数据误差的来源统计数据的误差指统计数据与客观现实之间的差距有登记

12、性误差和代表性误差两类登记性误差：由于调查者或被调查者的人为因素所造成的误差，理论上将可以消除控制方法：访问员素质高，抽样单位电话回访等。代表性误差：用样本数据进行推断时所产生的误差，通常无法消除，但事先可以进行控制和计算控制方法：样本容量大，合适的抽样方法等。四统计数据的质量要求精度：最低的抽样误差或随机误差准确性：最小的非抽样误差或偏差关联性：满足用户决策、管理和研究的需要及时性：在最短的时间里取得并公布数据一致性：保持时间序列的可比性最低成本：以最经济的方式取得数据第二章第二章基本统计分析基本统计分析.1.1频数分析频数分析.2.2计算基本描述统计量计算基本描述统计量. 频数分析频数分

13、析一.SPSS中的频数分布表v频数（Frequency)：变量值落在某个区间（或某个类别）中的次数。v百分比（Percent):各频数占总样本数的百分比。v有效百分比（Valid Percent):各频数占有效样本数的百分比。v累计百分比（Cumulative Percent):各百分比逐级累加起来的结果。最终取值为100。例1：某单位职工受教育程度的结构受教育程度小学初中高中大学硕士合计频数1229216受教育程度16.36.36.3212.512.518.8212.512.531.3956.356.387.5212.512.5100.016100.0100.0小学初中高中大学硕士Total

14、ValidFrequencyPercentValid PercentCumulativePercent频数分布表二.频数分析中常用的统计图1.条形图（Bar Chart）v用宽度相同的条形高度或长短来表示频数分布变化的图形v适用于顺序和分类变量的分析v纵坐标可以是频数，也可以是百分比2.饼图（Pie Chart)v用圆形及圆内扇形的面积来表示频数百分比变化的图形v利于研究事物内在结构组成等问题v饼图中圆内的扇形面积可以表示频数，也可以表示百分比。3.直方图（Histograms)v用矩形的面积来表示频数分布变化的图形v适用于定距形变量的分析v可以在直方图上附加正态分布曲线，以便于正态分布比较图

15、1 例中频率分析饼形图受教育程度12.5%56.3%12.5%12.5%6.3%硕士大学高中初中小学图2例中频率分析条形图受教育程度受教育程度硕士大学高中初中小学Percent6050403020100135613136图3例中频率分析直方图受教育程度5.04.03.02.01.0受教育程度Frequency1086420Std. Dev = 1.09 Mean = 3.6N = 16.00数据分布的特征和测度数据的特征和测度集中趋势离散程度分布的形状均值众数中位数方差和标准差全距偏度峰度一.刻画集中趋势的描述统计量均值(1)均值（Mean)l定义：全部数据的算术平均数l计算公式：niixnx

16、11l特点：最常用的测度值均值利用了全体数据易受数据中极端值的影响用于数值型数据，而不能用于分类数据和顺序数据(2)均值标准误差（Standard Error of Mean）l定义：反映样本均值与总体均值的平均差异程度l计算公式：nMean.of.E. Sl特点：揭示了用样本均值推断总体均值时误差的大小众数（ode）l定义：样本数据中出现频数最高的那个样本值l特点：不受极端值的影响可能没有众数或有几个众数（不唯一性）主要用于分类数据，也可用于顺序数据或数值型数据分类数据的众数（算例）某城市居民关注广告类型的频数分布广告类型人数比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其它广

17、告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100数据-分类数据0商品广告顺序数据的众数（算例）甲城市家庭对住房状况评价的频数分布回答类别甲城市户数（户）百分比（）非常不满意不满意一般满意非常满意24108934530836311510合计300100数据：顺序数据M0不满意中位数（Median)l定义：对样本数据由小到大排序，处于“正中间位置”上的数据l特点：不受极端值的影响主要用于顺序数据，也可用于数值型数据，但不能用于分类数据，各变量值与中位数的离差绝对值之和最小，即minMxn1ieil计算公式

18、（未分组数据）为偶数当奇数当nn)xx(21xMe12n2n21n数值型未分组数据的中位数（算例）原始数据：24,22,21,26,20个数据排序：20,21,22,24,26位置：1, 2, 3, 4, 5位置(n+1)/2=(5+1)/2=3e22原始数据：10,5,9,12,6,8个数据排序：5,6,8,9,10,12位置：1,2,3,4, 5, 6位置(n+1)/2=(6+1)/2=3.5e(8+9)/2=8.5四分位数(Quartile)l定义：通过三个点将全部数据等分为四部分，处在分位点上的数值就是四分位数l特点：主要指排序后25%（下四分位数）和75%（上四分位数）的位置上不受极

19、端值的影响主要用于顺序数据，也可用于数值型数据，但不能用于分类数据l计算公式：未分组数据：下四分位数（Lower Quartile):QL位置=(n+1)/4上四分位数（Upper Quartile):QU位置=3(n+1)/4中间的四分位数（中位数）：QM位置=2(n+1)/4数值型未分组数据的四分位数（7个数据的算例）原始数据：23,21,30,32,28,25,26排序：21,23,25,26,28,30,32位置： 1 , 2, 3, 4, 5, 6, 7QL位置=(n+1)/4=(7+1)/4=2QU位置=3(n+1)/4=3(7+1)/4=6QL=23 QU=30数值型未分组数据

20、的四分位数（个数据的算例）原始数据：23,21,30,28,25,26排序：21,23,25,26,28,30位置： 1 , 2, 3, 4, 5, 6QL位置=(n+1)/4=(6+1)/4=1.75QU位置=3(n+1)/4=3(6+1)/4=5.25QL=21+0.75(23-21) =22.5 QU=28+0.25(30-28)=28.5二.刻画离散程度的描述统计量适用条件：主要用于数值型数据全距（极差）（ange）l定义：一组数据的最大值与最小值之差l计算公式：iixMinimumxMaximumRl特征：离散程度的最简单测度值易受极端值的影响未考虑数据的分布方差和标准差（）方差（V

21、ariance）：l定义：各变量值与均值的平均差异l计算公式：l特点：最常用的离散程度的测度值反映了数据的分布2n1ii2)xx(1n1S（）标准差（Standard Deviation)l定义：方差的算术平方根l计算公式：21)(11niixxnSl特点：与变量值的计量单位相同比方差更常用第三章第三章 SPSS的简单应用的简单应用3.1 SPSS for Windows 的界面的界面3.2 建立数据文件建立数据文件3.3 用用SPSS进行基本统计分析进行基本统计分析.1 SPSS for Windows 的界面的界面一一.SPSS 的主窗口的主窗口 v启动SPSS后，弹出对话框选项如下：1.

22、Run the tutorial-浏览操作指导2.Type in data-显示数据编辑窗口建立新数据文件3.Run an existing query-运行一个已存在的文件4.Creat new query using Database Wizard-使用数据库向导建立一个新的文件5.Open an existing data source-打开一个已存在的数据文件，可选择“.sav”文件6.Open another type of file-打开一个已存在的其它类型的文件7.Dont show this dialog in the future-再运行SPSS系统时不显示该对话框，直接进入

23、数据编辑窗口v数据编辑窗口（SPSS Data Editor）或称数据编辑器的左下角包括“Data View”和“Variable View”两个视区，分别定义变量的值（即数据）和变量（名称、类型等）。二二.数据编辑窗口的主菜单数据编辑窗口的主菜单vEdit：文件编辑：文件编辑。完成文本或数据内容的选择、拷贝、剪贴、寻找和替换等操作。vView：浏览编辑：浏览编辑。完成文本或数据内容的状态栏、工具栏、字体、网格线和数值标签等功能的操作。vFile：文件操作：文件操作。完成文件的调入、存储、显示和打印等操作。vData：数据管理：数据管理。完成数据变量名称和格式的定义，数据资料的选择、排序、加权

24、，数据文件的转换、连接和汇总等操作。vTransform：数据转换：数据转换。完成数值的计算、重新编码和缺失值替代等操作。vAnalyze：统计分析。完成一系列统计分析方法的选择与应用。vGraphs：统计图表。完成统计图的建立与编辑。vUtilities：实用程序。有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。vHelp：帮助。帮助文件的调用、查询和显示等操作。vWindows：窗口控制。可进行窗口的排列、选择和显示等。选择“Variable View”项，定义变量（不要忘了保存）q Name：变量名。不能超过8个字符q Type：变量类型。共8种类型，分别为：.2 建立数据

25、文件建立数据文件一一.定义变量定义变量数值型变量（数值型变量（Numeric）Numeric为为标准数值型变量：默认总长度为8位，小数是2位。Comma为逗号型变量为逗号型变量：位数同上。整数部分，从右向左，每3位一个逗号。Dot为句号型变量为句号型变量：位数同上。整数部分，从右向左，每3位一个圆点，但对小数位的分割，应用逗号表示。字符串型变量（字符串型变量（ String）变量的长度是任意的。 Scientific notation为科学计数型变量。为科学计数型变量。如原始数据1231.3表示成科学计数型为12.313E2；Dollar为美元型变量。为美元型变量。在Comma型的基础上，增

26、加一个美圆符号。Custom Currency自定义型变量。自定义型变量。机器自动提示选择方法。日期型变量（日期型变量（Date）dd-mm-yy（日-月-年）如06-05-04mm-dd-yy（月-日-年）如05-06-04dd-mmmm(英文)-yyyy 如06-May-2004 当你选择Data类型后，系统会自动显示日期类型，供你选择。q Width：数据或字符串的宽度。默认值为8个字符。qDecimal：小数位数。q Label：变量标签。用来说明变量所代表的意义。qValue：对变量值的进一步说明。如：1=男，2=女qMissing：定义缺失值类型。系统遗漏值：数值变项读入了空白

27、值或非数值数据，SPSS的数据表上显示“.”。自定义遗漏值：特殊的数据，自己指定一个值，计算机会作为特殊值，计算时跳过。方法：1）在missing字段定义遗漏值；2）选择Discrete missing values(自定义离散遗漏值）或Range plus one optional discrete miss(范围内的离散)值。qColumns：定义数据在屏幕上该变量对应列的显示列宽。默认值为8个字符，范围是1-255。qAlign：定义数据在单元中的对齐方式。qMeasure：定义度量变量类型。可有Scale、Ordinal和Nominal。Scale：可以是数值型、日期型和货币型变量，但

28、不能是字符串型变量 Ordinal：可以是数值型和字符串型变量，一般要求变量有较明显的次序Nominal：与Ordinal一样，只是不要求变量有次序关系，但要有较明显的类别二二.输入数据输入数据选择“Data View”项，输入变量数据l 直接从数据编辑器中输入（前面已介绍）。l 用“Open File”选择已存在的数据文件读入数据。l 用“Open Database”读入数据。用“Open File”读入数据操作步骤如下：在 S P S S 数据编辑器中按照“FileOpenData”可打开“Open File”对话框；在“Open File”对话框中打开“文件类型”下

29、拉列表框，选中所要读入数据的类型，根据路径找到要读入的文件双击文件名即可。常用的是读入Excel数据。例1 请将下面表格内容在SPSS数据编辑器中输入。表1药品名药品名产地产地生产时间生产时间价格价格规格规格滴眼液A中国2003/4/14日2.5元8毫升滴眼液A日本2002/12/2日2.7元8毫升滴眼液A美国2002/8/29日2.85元8毫升滴眼液B美国2003/2/18日3.2元5毫升三三.编辑数据编辑数据1.修改数据找到所要修改的数据，激活（双击），修改即可。2.插入或删除一行数据插入行：点击所要插入的行号，点击工具栏（或击右键）的“插入行Insert case”的图标（望远镜图标的

30、后面），就在此行增加一空行。删除行：找到所要删除的行，选中，按Delete键。3.插入或删除一列（一个变量）插入列：点击所要插入的列号，点击工具栏的“插入列Insert case”的图标（望远镜图标的后面第2个），就在此列增加一空列。删除列：找到所要删除的列，选中，按Delete键。例2.在例1的数据文件中完成插入与删除的功能.4.合并数据文件(1)纵向合并数据文件打开第一个需合并的数据文件选择Data-Merge File-Add Case.输入需合并的SPSS数据文件名.单击“OK”即可.注意:(1)合并后的数据文件有意义. (2)不同数据文件中数据含义相同的数据项应起相同的数据名,数据类

31、型也相同.Unpaired Variable框-显示非公共变量*表示当前数据文件中的变量+表示被合并数据文件中的变量Variables in New Working Data File框-公共的变量被自动匹配显示在该框中Indicate case source as variable项若要求合并后的数据能看出来自哪个数据文件，则选中该项，以“0、1”区分例3.纵向合并下列两个数据文件表2 表3职工号(zgh)性别(xb)年龄(nl)基本工资(sr)职称(zc)11481014.0012149984.00232541044.0014241866.0045138848.002职工号(zgh)性别

32、(xb)职称(zc)624713823(2)横向合并数据文件打开第一个数据文件选择Data-MergeFile-Add Variables.输入需合并的SPSS数据文件名。单击“OK”即可.注意:(1)两个数据文件必须至少有一个名称相同的变量,称为关键变量. (2)不同数据文件中数据含义不相同的数据项,变量名不应相同.Excluded Variables框-显示公共的变量New Working Data File框-显示2个待合并的数据文件中的所有变量Match case on key Variables in sorted files项-从“Exclude Variables”框中选中变量作

33、为关键变量移至“Key Variables”框中Both files provide cases-合并后的数据由2个待合并的文件数据组成External file is keyed table-合并后的数据仅为当前数据文件中的数据Working Data File is keyed table-合并后的数据文件仅为被合并数据文件中的文件例4.将表4中的数据文件横向合并到表2中. 表4职工号(zgh)学历(xl)113352四四.保存分析结果保存分析结果保存结果文件保存结果文件在结果浏览窗口中选择菜单File=Save，在文件名框中键入“文件名”并回车即可.Export:选择输出的内容Expr

34、ot File:填入输出的目标文件名Export What:选择输出结果的哪些部分File:选择网页格式和纯文本格式例5.将例1中保存的数据文件导出为文本文件.3.33.3用用SPSSSPSS进行基本统计分析进行基本统计分析一数据排序l选择采单DataSort Casesl将主排序变量从左面的列表框中选到Sort by框中，并在Sort by框中选择按该变量的升序还是降序排序Ascending-升序，Descending-降序例：某班级男生的身高数据（单位：厘米）171 182 175 177 178 181 185 168 170 175 177180 176 172 165 160 178

35、 186 190 176 163 183二. 计算基本描述统计量u选择菜单AnalyzeDescriptive StatisticsDescriptiveu将需计算的数值型变量选择到Variable(s)框中。u单击Options按钮指定计算哪些统计量。Save Standardized Values as Variables:标准化变量标准化公式：标准化目的：去掉量纲的影响s/ )xx(zii例：计算例中的基本统计量结果解释：Descriptive Statistics2230160190175.827.563-.321.491-.140.95322身高Valid N (listwise)S

36、tatisticStatisticStatisticStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. ErrorNRangeMinimumMaximumMeanStd.DeviationSkewnessKurtosis22个男生的极差为30；最低身高为160，最高身高为190；平均身高为175.82，身高的标准差为7.563；偏度为-0.321呈左偏分布，说明较低身高的占少数，较高身高的占多数；峰度为-0.140，呈平峰分布，说明身高的分布与正态分布相比略有一些平峰。Std.Error是偏度和峰度的标准误差三.频数分析u选

37、择采单 AnalyzeDescriptiveStatisticsFrequenciseu将若干频数分析变量选择到Variable(s)框中。u单击Statistics按钮、Charts按钮、Format按钮选择输出项目。Variable(s)框存放变量Display frequency tables项显示频数分布表Statiatics统计对话框（）Percentiles Values项百分位数Quartiles输出25%,50%,75%的百分位数Cut points forequal groups输入-100之间的整数，常输入，则用百分位数将数据等分，输出25%,50%,75%的百分位数Per

38、centiles输入-100之间的数，如输入2.5，则输出2.5%的百分位数（）Dispersion项离差量Std.deviation标准差Variance方差Range全距Minimum最小值Maximum最大值S.E.mean标准误差（）Central Tendency项中心趋势量Mean平均数Median中位数Mode众数Sum和（）Values are group midpoints项数据分组后选中该项（）Distribution项变量分布Skewness偏度及其标准误差Kurtosis项峰度及其标准误差Charts图形对话框（）Chart Type项None不输出图形Bar char

39、ts条形图，高度代表频数Pie charts饼形图，数值表示频数Histograms直方图，选择“With normal curve”项，图中带有正态曲线（）Chart Values项Frequencies纵轴表示频数Percentages纵轴表示百分比Format格式对话框（）Order by项用于定义频数分布表数据的排列顺序Ascending values数据按升序排列Descending values数据按降序排列Ascending counts频数按升序排列Descending counts频数按降序排列（）Multiple Variables项多变量项Compare variable

40、s将变量的结果显示在同一图形中Organize output by variables将变量的结果显示在不同的图形中Suppres tables with more项当频数分布表的组数大于“than categories”中的值时，按该值表示的组数显示例：某单位职工受教育程度的结构受教育程度小学初中高中大学硕士合计频数1229216频率（%）6.2512.512.556.2512.5100 画出表示频数和频率分布的条形图、饼图和直方图。输出结果：Statistics受教育程度1603.56.2734.0041.0941.196-1.056.564.7581.091415571.003.004.

41、004.00ValidMissingNMeanStd. Error of MeanMedianModeStd. DeviationVarianceSkewnessStd. Error of SkewnessKurtosisStd. Error of KurtosisRangeMinimumMaximumSum2.5255075Percentiles受教育程度16.36.36.3212.512.518.8212.512.531.3956.356.387.5212.512.5100.016100.0100.0小学初中高中大学硕士TotalValidFrequencyPercentValid Per

42、centCumulativePercent受教育程度硕士大学高中初中小学图1 频率分析饼形图编辑饼图：双击此图1）改变颜色：选择要改颜色的图形-选择Fomart-Color命令-选颜色-Apply按钮-Close按钮(也可直接单击图标）2）分割饼图：选择要分割的图形-选择Format-ExplodeSlice3）加入标题：选择Chart-Title-输入标题名-OK4）加入注释：选择Chart-Options命令-在Lables选中Text、Percents-单击Format-选择Number inside,text outside-Continue-ok受教育程度12.5%56.3%12.5

43、%12.5%6.3%硕士大学高中初中小学受教育程度受教育程度硕士大学高中初中小学Frequency1086420图2 频率分析条形图条形图编辑：1）显示数字：Fomart-Bar Lable Style-Standard-Apply All2)变立体图： Fomart-Bar Style-3-D effect-Depth=30%(阴影比例）（或直接单击图标）受教育程度受教育程度硕士大学高中初中小学Percent6050403020100135613136图3 频率分析直方图受教育程度5.04.03.02.01.0受教育程度Frequency1086420Std. Dev = 1.09 Mean

44、 = 3.6N = 16.00.1 常用统计量及其分布常用统计量及其分布.2 样本特征数与总体特征数的关系样本特征数与总体特征数的关系.1 常用统计量及其分布常用统计量及其分布样本均值样本均值样本方差样本方差样本标准差样本标准差nkkXnX11nkkXXnS122)(11nkkXXnS12)(11一一.常用统计量常用统计量二二.统计量的分布统计量的分布1.正态分布（1）总体X服从正态分布N（，2）(2) 标准正态分布临界值标准正态分布临界值标准标准正态分布的上正态分布的上分位点分位点Z Z1-=-Z (z)=1- ZZPZ2. t分布分布(1) t分布临界值分布临界值t分布的上分布的上分位点分

45、位点t (n)t(n)(nttPn45, t (n) zZ为标准正态分布上分位点分位点t1-=-t (2)两个重要结论两个重要结论结论1:设总体X服从正态分布N（，2）, 2未知.(x1,x2,xn)为来自该总体的样本则统计量) 1(/ntnsXT结论2:设总体X服从正态分布N（1，2）总体Y服从正态分布N（2，2）( 2 未知),X与Y独立，且X1，X2，Xn1和Y1，Y2，Yn2分别是来自总体X和Y的样本，则统计量 )2()11(2) 1() 1()()(21212122221121nntnnnnsnsnYXT 分别是两总体的样本均值，s12 及s22分别是两总体的样本方差，n1及n2分

46、别是两样本的容量。XY其中和3.F分布分布(1) F分布临界值分布临界值F分布的上分布的上分位点分位点F (n1,n2)F(n1,n2),(1),(12211nnFnnF),(21nnFFP F（n11，n21）其中s12 和s22 分别是总体X和Y的样本方差。21222221SS(2)一个重要结论一个重要结论设总体XN（1， 12 ），YN（2， 22 ），X与Y独立，且X1，X2， X n l与Y1，Y2，Yn2分别是来自总体X和Y的样本，则统计量F=.2 样本特征数与总体特征数的关系样本特征数与总体特征数的关系v总体X的特征数：E（X）= D（X）= 2 v样本特征数：nkkXnX1

47、1nkkXXnS122)(11v关系：22SX第五章第五章假设检验假设检验5.45.4用用SPSSSPSS统计软件进行假设检验统计软件进行假设检验假设检验假设检验: :参数参数的检验的检验分布分布的检验的检验参数的检验包括参数的检验包括: :一个正态总体一个正态总体( (均值和方差均值和方差) )的假设检验的假设检验两个正态总体两个正态总体( (均值和方差均值和方差) )的假设检验的假设检验假设检验假设检验: :双边检验双边检验( (等号成立等号成立) ) 单边检验单边检验( (不等号成立不等号成立) ) 5.1 假设检验一、假设检验的统计思想(以双边检验为例)例1: 某车间用一台包装机

48、包装葡萄糖，包得的袋装糖重服从正态分布.当机器正常时,其均值为0. 5公斤.某日开工后为检验包装机是否正常工作，随机地抽取它所包装的糖9袋，称得净重为（公斤）。 0.497 0.506 0.518 0.524 0.4980.511 0.520 0.515 0.512 问这天包装机工作是否正常？分析：设这天包装的糖重为X,XN(,2 ），判断:00.5公斤?是，则包装机工作正常，否则包装机工作不正常。作假设 H0：0=0.5（零假设） H1： 0=0.5（备则假设）在原假设H0成立的情况下的取值与0的差异| 0 |应较小而事件“| 0 |相当大”则为小概率事件Xx X差异小与差

49、异小，则与若差异小与已知00XXxx假设检验推断的依据:小概率事件原理.即:小概率事件在一次试验中几乎不可能发生.未知,但知设“| 0 |K”为小概率事件，若给定（为很小的正数），K可由下式确定，令 P| 0 | K 为显著性水平 X) 1(/0ntnsXtnsKnsxPKXP/00Xt为检验统计量于是，即)1(2nttP l 根据小概率事件原理，如果由样本的一次观察值计算的样本均值满足不等式l表明小概率事件在一次试验中居然发生了，这样我们就有理由说假设H0有问题。从而作出拒绝假设H0推断，否则，我们便作出接受假设H0的结论。) 1(2ntt/2/2 1- -t /2(n-1)t /2 (n

50、-1) 接受域拒绝域拒绝域为临界点为拒绝域区域) 1() 1(22ntntt)1(2nttP已知s=0.009391，n9，取0.05，则 51122. 0 x306. 2)8() 1(025. 02tnt306. 2585. 3/0nsxt于是因此在0.05下，拒绝H0，即认为这天包装机工作不正常。此例中，计算得二二. .假设检验的基本步骤假设检验的基本步骤( (双边检双边检验验) ) (1) (1)作假设作假设H0：0（零假设） H1：0（备则假设） (2) (2)选择检验假设选择检验假设H0 的统计量，并确定其分布的统计量，并确定其分布 (3) (3)据样本观测值计算出该统计量的值据样本

展开阅读全文