1、计量资料的统计推断计量资料的统计推断l 抽样分布抽样分布l总体均数的置信区间估计总体均数的置信区间估计l总体均数的假设检验总体均数的假设检验l总体方差的假设检验总体方差的假设检验l假设检验中的两类错误假设检验中的两类错误统计推断统计推断 参数估计参数估计 统计学推断统计学推断 假设检验假设检验用样本的信息去推断总体的特征用样本统计量估计总体参数对总体的特征作出一定的假设,借助统计量的分布和小概率事件原理对所做的假设进行推断点估计区间估计Statistical inference 用样本的特征推断总体的特征称作统计推断。统计推断是研究人群健康过程中经常用到的方法。总体总体样本样本样本样本样本样本
2、抽样抽样结果结果统计推断统计推断均数的抽样误差与标准误均数的抽样误差与标准误q均数抽样误差(均数抽样误差(sampling error)抽样引起的样本与样本之间的均数,样本与总抽样引起的样本与样本之间的均数,样本与总体之间的均数差异。体之间的均数差异。q均数标准误均数标准误(standard error)定义定义 样本均数的标准差。样本均数的标准差。计算 nxnssx均数标准误的意义均数标准误的意义 度量均数抽样误差大小的指标,表明样本均数之间的变异度的大小。标准差越小,抽样误差越小,样本均数与总体均数越接近,用样本均数估计总体均数的可靠性越大;反之,抽样误差越大,样本均数围绕总体均数越分散,
3、样本均数估计总体均数的可靠性越小。t分布分布正态分布正态分布总体总体N(,2)样本含样本含量相等量相等若干个样本均数若干个样本均数N(,x2)xUxxUnsxsxtx/正态分布曲线与t分布曲线的比较 t分布的特征分布的特征lt分布是关于自由度的一簇曲线。l横轴是t值,纵轴为t的概率密度函数。l中部95的t值在-t(0.05/2,)t(0.05/2,)之间,双侧外部的概率(P值)为5 当当一定时,一定时,t t值可以计算出具体的数值可以计算出具体的数值值 见见P178P178:附表:附表 9-19-1问题一问题一lt值与值与P值的关系?值的关系?lt值与自由度值与自由度的关系?的关系?lt t分
4、布与正态分布的关系?分布与正态分布的关系?问题二问题二?),(),(2501.02505.0tt问题三问题三?时,?时,PtPt75.175.32525标准误与标准差的联系标准误与标准差的联系l两者均是表示变异度大小的统计两者均是表示变异度大小的统计指标指标l标准误与标准差大小成正比,与标准误与标准差大小成正比,与抽样例数的平方根成反比抽样例数的平方根成反比l当样本例数一定时,同一份资料当样本例数一定时,同一份资料,标准差越大,标准误也越大标准差越大,标准误也越大标准差与标准误的异同标准差与标准误的异同q标准差描述一组变量值之间的离散趋势 s值越小,表示变量值围绕均值分布越密集;说明均数的代表
5、性越好可用 估计变量值范围 n越大,s 越趋于稳定p标准误描述样本均数间的离散趋势标准误越小,表明样本均数与总体均数越接近,说明样本均数推断总体均数的可靠性越大可用 估计总体均数可信区间n越大,标准误标准误 越小suxxstx,总体参数的估计总体参数的估计点估计点估计(point estimation)直接用样本指标的值作为总体参数直接用样本指标的值作为总体参数相应指标的值。相应指标的值。如;如;xxssx,总体参数的估计总体参数的估计区间估计区间估计(interval estimation)q置信区间(置信区间(confidence interval)按一定的概率来估计总体参数所在的范围,该
6、范围按一定的概率来估计总体参数所在的范围,该范围称为参数的置信区间。即有称为参数的置信区间。即有121P1-置信度或置信水平置信度或置信水平),(21置信区间置信区间置信区间的两个要素置信区间的两个要素准确度准确度 置信区间包含参数的概率大小,其置信度的大小置信区间包含参数的概率大小,其置信度的大小用用1-表示。置信度越接近于表示。置信度越接近于1,准确度越高。,准确度越高。精度精度 衡量总体参数的估计范围,即置信区间的长度。衡量总体参数的估计范围,即置信区间的长度。区间的长度越短,估计的精度越高。区间的长度越短,估计的精度越高。(1)置信区间是一个随机区间,对于不同的样本,置信区间是不同的(
7、2)置信度表示置信区间包含总体的参数的概率,而不是总体参数落在置信区间内的概率说明说明总体均数的区间估计总体均数的区间估计总体已知总体均数的95%的置信区间:总体均数的99%的置信区间:)96.1,96.1(nxnx)58.2,58.2(nxnx总体均数的区间估计总体均数的区间估计总体总体未知。未知。n较大时较大时总体均数的95%的置信区间:总体均数的99%的置信区间:)96.1,96.1(nsxnsx)58.2,58.2(nsxnsx总体均数的区间估计总体均数的区间估计总体未知,n较小时总体均数的95%的置信区间:总体均数的99%的置信区间),(,205.0,2/05.0nstxnstx),
8、(,201.0,2/01.0nstxnstx例题例题9.1:P168 LmmolLmmolsxtnstxnstxtn/628.1,968.0%95/628.1968.0)17663.0110.2298.1,17663.0110.2298.1663.0298.1110.2),%95171817,205.017,205.017,205.0)置信区间为(总体均数的该地健康男子甘油三脂),即(计算得置信区间为:,而(的置信区间为:得总体均数的分布未知,故由,总体未知。n较大时例例 从某市抽得从某市抽得120名名12岁男孩,求得岁男孩,求得其身高均数为其身高均数为143.05cm,标准误为标准误为0.5
9、5cm,试估计该市,试估计该市12岁男孩身高岁男孩身高均数均数95%的置信区间。的置信区间。总体未知。n较大时cmnsxnsxsxnx),(的置信区间为:岁男孩身高总体均数(用正态近似法代入较大13.14497.141%9512)96.1,96.155.0,05.143,120假设检验假设检验q假设检验的基本原理假设检验的基本原理 某物质在某溶剂中的标准含量为20.7mg/L重复测定该物质样品9次,其测量值如下:20.99,20.41,20.1,20,20.91,22.41,20,23,22已知总体均数 =20.7mg未知总体均数0样本9,225.1,09.21nsx测定结果与实际值有无差别?
10、样本均数不等于总体均数20.7两个总体不是同一总体两总体为同一总体抽样误差引起先提出假设然后借助统计量的分布和小概率事件原理如何判断假设检验的一般步骤假设检验的一般步骤建立检验假设建立检验假设统统计计假假设设无效假设(零假设)(null hypothesis)备择假设(对立假设)alternative hypothesis)假设无差异或假设无差异或相等的情况相等的情况假设有差异或不假设有差异或不等的情况等的情况0H1HKx|差异是抽样差异是抽样误差所致误差所致Kx|总体不同所致0H1H)1(ntnsX拒绝拒绝0HK如何确定?t 值公式值公式)1(ntnsX显著性水平显著性水平当无效假设为真时当
11、无效假设为真时,拒绝无效假设拒绝无效假设 所所犯的概率。记为犯的概率。记为。一般取。一般取=0.05,0.10,0.01。0H05.07.207.20:10总体均数不相等,即:未知总体均数与已知体均数相等,即未知总体均数与已知总HH计算计算t 值值nsXt判断判断P值,得结论值,得结论成立不成立0)(05.00)(05.0,05.0,05.0,HPttHPtt说明说明(1)假设是针对总体而言的,而不是针对假设是针对总体而言的,而不是针对 样本而样本而言的言的(2)无效假设一般假设是相等的情况)无效假设一般假设是相等的情况(3)P值的大小不能说明差异的大小值的大小不能说明差异的大小 (4)推断结论不是绝对的推断结论不是绝对的,而是相对的而是相对的,带有一定的带有一定的概率性概率性 (5)假设有单侧和双侧之分,需根据研究目的和专假设有单侧和双侧之分,需根据研究目的和专业知识来确定业知识来确定
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。