1、 第八章 统计假设检验在平差中的应用 8.1 基本原理一、数理统计的主要方法1)参数估计:由有限个子样推断母体分布中的某些参数;2)统计假设检验:根据子样信息,通过检验来判断母体分布是否具有指定的特征。 统计假设检验=假设检验假设检验依据:是以“小概率在一次实验中是不可能发生的”这一概念为前提的。二、假设检验主要解决问题 母体的数字特征是否等于一个指定的值?不同母体的数字特征是否相等?假设检验在测量上的应用: 系统误差的检验、测量精度的比较、理论值是否与观测数据相符合的检验等问题。假设检验的过程不同于数学定理的证明:一个定理不带随机性,而假设是否被接受则受到抽样随机性的影响。?22212022
2、10aaaa即布进行假设。知道,对其服从什么分的分布也不非参数假设:假设母体:。如已知:数求分布函数中的参数体的分布函参数假设:假设已知母从检验内容上分、备选假设原假设从检验次序上分100,15. 1 ,02210aHaNXHHH复习:正态分布表的查法(小概率)查表得:时,当时,求分位值:已知设已知96. 1975. 0212205. 01121211 , 022222222222uuuuuuuuuPuuPuuuPNu、也称显著水平、风险度 常用正态分布的小概率及其 u 分位值:58. 299. 001. 096. 195. 005. 065. 190. 010. 012u大被拒绝的可能大,大
3、,拒绝域分位值置信度或信度021Hu8.2 假设检验步骤:(以u检验为例) 1 , 0)2) 10000NnaxnaxuHaaH成立:构成统计量并认为:作原假设。且已知:,算得子样均值组子样首先,在母体中抽取一定常数。指。已知,要求检验,设母体naNxxxxxaaaaNXn2210022,一、假设检验步骤差异显著。与,即认为绝。否则,拒,认为:落在接受域内,则接受若其余区间称为拒绝域。,该区间称为接受域,)落入区间的概率(接近应该以推断:即:值进行概率计算,给定0000222022211001)411)3aaHaaHuuuuunaxuPuuuP二、对检验统计量的要求(1)适合于所做的假设;(2
4、) 统计量中不含有未知量; (3)应知其概率分布,可以求分位值。假设检验的关键:找一个适当的、知其分布的统计量,从而确定该统计量经常出现的区间,使统计量落入该区间的概率接近于1。四种基本的假设检验方法:。、两参数检验的内容是该母体的从正态分布的母体,检验用的子样均来自服检验法检验法检验法检验法22aFtu 。的期望是,认为:下,接受即在落入其中,接受域为:,则此题若取:。的期望不是,认为:下,拒绝在未落入其中,即接受域为:,查表得:由解:统计量:,检验试以算得子样均值由子样已知例5001. 058. 2 ,58. 258. 201. 0501 . 0,65. 1 ,65. 165. 11 .
5、025. 292 . 1509 .50501 . 09 .50,2 . 1 ,. 1020200912xHuuxHuunaxuaHxxxaNX结论:的选择要很慎重,故也称为风险度。假设检验的第一类错误:弃真拒绝实际上成立的假设。 犯弃真错误的概率为 。(设 =0.05。即就算H0是正确的,但仍有5的统计量落在拒绝域内)。第二类错误:纳伪接受实际上不成立的假设。犯错误的概率为 。 当子样容量n确定后,犯两类错误的概率不可能同时减小。 弃真较之纳伪是更加严重的错误。三、u检验法检验母体的数学期望是否与一常数相符 拒绝域公式接受域公式:,有子样均值:独立子样个已知)中,抽取(其中在母体2200221
6、2211 , 0,uuPuuPNnaxuaaHnaxxxxnaNXn1 1、检验原假设:、检验原假设:2 2、u u检验统计量:检验统计量:3 3、u u检验概率公式:检验概率公式:4 4、u u检验应用范围检验应用范围a)子样容量 对于正态母体,对子样容量n不作要求,可小子样;对于非正态母体,n至少为30,需大子样。(中心极限定理:n很大时,独立随机变量之和渐近于正态分布)b)要已知母体方差 因很多母体的方差 未知,故对u检验的限制很大。若为大子样,可用子样无偏方差 代替 。( 是 的渐近无偏估计)222222 。,认为系统误差不明显故接受时,统计量:解:若是偶然误差误差?,问闭合差是否为偶
7、然合差中误差为,已知闭均值个三角形,得闭合差平例:观测了020,58. 201. 098. 142162. 006. 00:001. 026 . 060 . 0421HunaxuaHEx 。较小的差异就变得敏感对的接受域就越小,这样,越大,确定,则选定后,敏感:大子样对判别0000222HxanuxanunuH c)、检验两正态母体的期望是否相等。 H0:a1=a2 1 , 0,22212121222121212221212122221211221121222211NnnaayxunnaaNyxnnyDxDyxDaayExEyxEnaNynaNxyyyxxxaNYaNXnn标准化得统计量:构成
8、新的统计量:子样均值子样(互独立)正态母体 例:无显著差异。原假设,认为两人观测的水平上接受。所以在因统计量:解:原假设:?所得结果差异是否显著,问二人度的中误差均为量资料,知他们观测纬似观测的大,根据两人以往进行类和数各为次,得平均值的秒地纬度各设有甲、乙二人观测某05. 096. 116. 016. 0818163. 018. 113. 105. 036 . 081 . 131 . 18212212121210 uunnxxuaaH四、卡方检验法-检验母体的方差是否与一常数相符。卡方检验在测量中常用于检验精度。原假设 :2020:H 。),在此之外为拒绝域,域分位值为(接受。由于其图像不对
9、称,分布的密度函数及图像变量恒为正。参数。变量自由度,是其唯一;两两独立,且变量。变量22221222222222212221 , 01nNxxnxxxiin1、卡方分布 212212122212122222222222,4307.18,05. 0,1032nnYYYYnYnYnnPxKdxxKP则互独立和,且若分布的可加性查表得:如;分布表。而制成的代入公式,可求得不同及小概率用不同的自由度的概率。值位分取值超过密度函数,按公式制表式分布表右尾拒绝域 。的测角精度无显著差异的水平上认为新旧仪器故在,落入区间内。故接受,查表得:统计量:解:差异?原仪器相比,有否显著,问新仪器测角精度与为测回,
10、得一测回中误差测角,今用试制的同类仪器为器测角中误差多年测角资料知该类仪例:用经纬仪测角,由子样方差。子样无偏方差;子样容量;或05. 054.17818. 282 .145 . 121915 . 105. 00 . 295 . 11 1102222122222202022222222 HZnZHsnnnsZnnZ2、卡方检验法的统计量3、单双尾检验的适用范围 ,否则拒绝。域内则接受落入双尾分位值构成区统计量,右尾:左尾:大小不变。双尾分位值拒绝域放在双侧,:。接受,大于该值均为合格,只需设置左尾分位值拒绝域概率为:大小不变。,此时拒绝域全放在左侧:。接受,小于该值均为合格,只需设置右尾分位值
11、拒绝域概率为:大小不变。,此时拒绝域全放在右侧:0222212020021212022020022202202011)111)111)HZnnHcHnnnPHbHnnnPHa五、t 检验法-检验母体的数学期望是否与一常数相符与u检验的区别:t检验不用知道母体方差,可小子样。1、t分布学生分布 1) t 变量 2)t 分布的密度函数与图像(对称分布) 3)t 分布表 分布变量服从的分布互独立分母:分子:ttnzNuntnzut21 , 0 分布表。代入上式制成和用不同的:密度函数,tntgdttgttPt 2、t 检验的统计量 检验的实际结果一致。检验与时,的自由度当统计量为:分布的服从于已知:
12、变量:tuntntnsaxnaxnnnaxnzutttnnsnzNnaxuntnzutt30111111111 , 02222222 差。认为测距仪不含系统误的水平上接受原假设,故在,因分布表得查,自由度以统计量:,且已知是否等于学期望解:本例检验母体的数之间的差异是否显著?与问,一测回中误差为测回,平均值用测距仪测设无误差,仪,已知基线长例:在基线上检验测距05. 0231. 28105. 029006. 0124.4861128.4861)006. 0(05. 0006. 0,128.48169,124.4816220022000ttttnnaxtLaHmLaLLmmLmL拒绝域接受域22
13、1ttPttP3、t检验公式 4、t 检验法检验两正态母体的期望是否相等1 , 011,212122122122212221212122212221210NnnaayxunnaaNyxnzuttssnaNynaNxnnaNaNaaH标准化后:其中分子:统计量:子样方差子样均值子样容量两正态母体假设: 22) 1() 1(22221212121212222112121212121222211212121222221122nntnnnnnnnnaayxtnntnnnnnnsnsnaayxnnzutnnsnsnz或分布的可加性得分母:根据六、F检验-检验两正态母体的方差是否一致 第二自由度。第一自由
14、度;分布。服从互独立,变量为变量为nmFnmFnmnmFnmF,22222122211、F变量2、F分布的密度函数与图像(不对称分布) mnFfnmFfFfFPfFP,1,2,2222222查左尾分位值:查右尾分位值:检验一般为双尾检验。拒绝域概率为 。,右尾值永大于左尾值永小于,分布表。在该制表式中代入上式制成及将不同的11,FnmdxxffFPf3、F分布表右尾拒绝域制表式-“二倒”查表法 4、F统计量。时,拒绝当落入左尾拒绝域内。考虑,此时可不必永大于,即统计量为检验方便,永选时,成立互独立。、;。、偏方差的子样,并算得子样无量为,从中分别抽取容,设有两正态母体:022221222102
15、122222222121122212222112221011, 11111,HfFFFnmFFHZZnnZmmZnmaNaNH有F统计量为: 精度无显著差异。两台仪器的测角,故接受原假设,认为由于查得,都是按分子、分母的自由度成立下,求得:在:解:原假设:)精度有否显差异(,问该两台仪器测角的为测回,得一测回中误差;第二台也观测中误差为测回,一测回仪测角,第一台测例:用两台同类型经纬44. 356. 2,44. 305. 02856. 25 . 14 . 2?10. 04 . 295 . 19, 12220222102 FfFHHnFnt5、t变量与F变量的转换关系 11, 11111111
16、, 022222122212221222220222221022210fFfPnmFFFPnnttPntnaxtaaaatuuPNnaxuaaaau检验法检验法可不知略检验法要求已知略检验法检验方法 原假设H0 统计量 检验公式U、t检验法-检验系统误差;卡方、F检验法-检验精度。8.3 偶然误差特性的假设检验 由于观测误差出现的随机性,实际的误差分布(以频率为基础的经验分布)不可能与理论分布(以概率为极限的理论分布)完全吻合。要验证这种波动是否在某种允许界限内。若波动超越范围,说明观测列中有系统误差或粗差存在。 5 . 0101,0; 1021qpHpqpxpnBSSxxxxSxxixixx
17、nxiiiii:。和的概率分别为和取设服从二项分布:数误差列中正误差个为负,误差为正,个误差的正负号。误差表示误差列中第设以1 1、误差正负号个数的检验、误差正负号个数的检验 2 2、正负误差分配顺序的检验、正负误差分配顺序的检验 有时正负误差个数大致相等,但一段时间内都为正,另一段时间内都为负,具有系统误差倾向。5 . 0, 110101211qpHpnBSyyySnnqypyyynyiiiii:同样,相邻两误差同号的个数个交替变换:个误差时,有有概率:异号:概率:同号:表示。之间的符号用、设相邻两误差3 3、误差数值总和的检验、误差数值总和的检验、个别误差值的检验、个别误差值的检验P214
18、 例8-7望为零。,即:误差数值和的期:理论上,将一列误差求和:00021SEHSESn 8. 后验方差的检验测量平差按给定的函数模型和随机模型进行。参数的估值能否最优无偏,取决于上述两模型的正确性。若平差中存在:1、平差模型有偏差;2、起始数据不正确;3、观测值有系统误差;4、定权不正确;5、参数近似值取得太差等,均会影响平差结果。间接观测方差分布定理:母体方差母体方差估值;变量。为且互独立,与估值间接平差所得的各参数202220220tntnPVVPVVxTTi,认为平差模型正确。若接受检验公式:检验统计量:原假设的。,说明平差模型是正确差异,即,若两者无显著差估值差后可得验后单位权方是已
19、知的,平位权方差平差前定权时的先验单022221220202020200202020201HzPtnPVVtnzEHET教材P74,例5-1题,水准网平差确的。准,该题平差模型是正。认为若作为是三等水拒绝,故接受表。得接受域为查,以自由度。统计量中,算得分别代入及将统计量:若为三等水准,:若为二等水准,后验方差检验:。;等外水准;三等水准二等水准由水准测量等级而定:其该例定权时,取容容1222120202020202020200202000000),838.12,072. 0(01. 0349.10,45.940 . 90 . 1 45.94 0 . 90 . 1 3 .133401400 .
20、 30 . 1,1zztnzzzPVVtnzEHEHffspTmmhmmKMmmhmmmmii教材P128,例6-6,测边网可见平差模型不正确。,查表得:用统计量:平差时取验前单位权为的测距仪测得,为设该测边网用标称精度833.12,831. 001. 0, 5 4 .21778. 713134 78. 778. 7:25222212202202000fPVVzEHsppmTmmmms不正确的主要可能是:1、定权不正确;2、起始数据误差大或测边有系统误差。8.5、参数区间估计 ?相差多少?可靠性如何与相差多少?与究竟参数点估计估计母体方差用估计母体期望用2222axax参数区间估计-估计真值出
21、现的范围及这个范围包含真值的可信程度。 一、对母体期望a的区间估计。检验公式估计置信区间已知,可用若随机区间。间也为是随机变量,故置信区此区间称置信区间。因,的概率落入区间以即期望代入:检验公式:按uxntxntxantxantxPnaxttttPttPt22222222111 内。,的概率落入区间应以即母体方差代入:将检验公式:按2212222222122222222222221211111111nnnnPnP二、对母体方差的区间估计三、测量值的不确定度不确定度:估值以多大的概率出现在真值的范围内。由 t 检验公式可得:122ntaxntaP种方法为统计方法。的不确定度。这就是算术平均值公式
22、中的面值不能认为是真值,上因为存在测量误差,估xnt2. 附加系统参数的平差附加系统参数平差法:减弱系统误差对平差结果的影响。一、模型误差的概念。,动,数轴上产生了移分布,而是母体期望在,存在的观测误差不服从系统误差:有系统误差220aNNi 误差引起的。最优的,这是由于模型将不是模型求出的参数估值此时再用传统的,差和粗差时,当观测值中含有系统误xMGE0二、附加系统参数平差原理 在传统的G-M模型中加入系统参数,对系统误差进行削弱。 均为列满秩阵其中得误差方程:由附加系统参数系统偶然观测误差模型:推广的mARtBRlsAxBVsPDLDsAEsAXBLMGnmnmtntnGG,1),(21,
23、111112020)4( ) 3( )2( s ) 1 ( 01 11121112111111 1211121111111112111212222211211MQNNMNNNQxNPlAMsNNxxPlBNxNNNNMNNNNPAAPBAPABPBBPlAPlBsxPAAPBAPABPBBs sxxTTTTTTTTTTTT:权逆阵含系统误差时:模型不含系统误差时:且设设法方程: 例:P244。、)式求得()可用上一页的公式(。相应于两点高程参数,、为、式中:,其误差方程为:系统误差每站高差观测值中都有,则统误差的标尺测得高差水准测量中,若用有系s sxxijijijijijijijijijij
24、QQsxsAshijxxHHhllshxxVsh 41 若是有系统误差的观测值却用若是有系统误差的观测值却用“间接平差模型间接平差模型”处理、或是无处理、或是无系统误差的观测值却用系统误差的观测值却用“附加系统参数平差模型附加系统参数平差模型”处理,都会处理,都会产生模型误差,给平差结果的正确性带来影响。产生模型误差,给平差结果的正确性带来影响。三、系统参数的假设检验(平差模型正确性检验) 基本思想:若以上两式联立平差解得的单位权方差与单独平差(1)式所得的单位权方差无显著差异,则说明(1)式中已包含了(2)式,故原假设成立。若差异显著,则H0不成立。 20110:原假设为:有误差方程:、线性假设检验sHlsAxBV PVVVxPVVVxTATAAAA, 21,1改正数两式,得参数、联立平差改正数,得参数单独平差 ,认为系统误差显著。则拒绝,若检验:可用;定理:根据间接观测方差分布项后对单位权方差的影响为考虑了其中的关系:和0202022022001 ,)(HmtnmFFtnmFmtnmRmtnmRFFmRtnHsQsRRVVPVVPVVPVVAAs sTAATAATATA