1、2022-11-26王玉顺:数理统计03_描述统计12022-11-26王玉顺:数理统计03_描述统计2本章内容n3.1 离散样本的频数统计离散样本的频数统计n3.2 连续样本的频数连续样本的频数统计统计n3.3 三维统计图三维统计图n3.4 基于观测的统计计算基于观测的统计计算n3.5 基于频数的基于频数的统计计算统计计算3 描述统计2022-11-26王玉顺:数理统计03_描述统计33.4 基于观测的统计计算Statistic Calculating based Observation3 描述统计2022-11-26王玉顺:数理统计03_描述统计4 基于观测的统计计算,指直接利用抽样获得的
2、n个样本观察值样本观察值(observation)x,x,x 计算均值、方差、标准差、变异系数、协方差、相关系数、偏度和峰度等样本样本统计量观察值统计量观察值(statistic observation)引言3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计5 无论离散变量还是连续变量,样本观察样本观察值值(observation)、统计出的频数频数和频率频率都是有限离散的。因此,无论离散变量还是连续变量,统计量观察值统计量观察值(statistic observation)的计算本质上都是离散运算,其算法及公式均相同。后面讨论的问题均属于离散运算,如求和、求均值、求
3、方差、求协方差等。引言3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计6样本均值反映样本观察值的集中趋势(central tendency)nXExnxnii当,11xnxnxnii111样本均值比较(1)计算样本均值xxnii1简化:3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计7.xxn 148997 805x 489(1)计算样本均值序号序号xyx2y2xy1969892169604940829910098011000099003104108108161166411232496979216940993125949388368649
4、8742合计 4894964788549326485943.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计8 niisxxn 22111 niisxxVar Xnn 222111,当 niisxxn 2111比较样本方差反映样本观察值的离散程度(variation level)样本标准差样本方差(2)计算样本方差及标准差3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计922211xxxnSSsnn样本方差22211xxxnSSssnn样本标准差(2)计算样本方差及标准差x2x先计算3.4 基于观测的统计计算2022-11-26王玉顺:数理统
5、计03_描述统计10 222222222222211xxxxxxxxxxnxxxxnnxxSSn (2)计算样本方差及标准差校正的平方和离差平方和3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计11247885489xx (2)计算样本方差及标准差序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594 .22247885489 560 80 xSSxxn 3.4 基于
6、观测的统计计算2022-11-26王玉顺:数理统计03_描述统计12 .xxnsn 222247885489 515 20151(2)计算样本方差及标准差序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594.260 815 20151xSSsn 247885489xx 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计13 .22247885489 53 898715
7、 1xxnsn (2)计算样本方差及标准差序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594247885489xx .60 83 8987151xSSsn 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计14.vscx3 898721001003 986497 8变异系数(3)计算样本变异系数序号序号xyx2y2xy196989216960494082991009
8、80110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594.3 8987297 8sx 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计15样本协方差()cov(,)111niixyix yxxyysn 11xyxyxyxynSPsnn协方差计算公式(4)计算样本协方差校正的叉积和定义来自3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计16(4)计算样本协方差211xySPxxyyxyxyxyxyxyyxxynnx
9、yyxn校正的乘积和(校正的叉积和)3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计17xy 48594x 489y 496先计算两样本的观测和与叉积和(4)计算样本协方差序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 4894964788549326485943.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计18(4)计算样本协方差序号序号xyx2y2xy1969892169
10、6049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 48949647885493264859448949648594xyxy 再计算校正的叉积和 .1148594489 49685 25xySPxyxyn 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计19 .1148594489 496521315 1xyxyxynsn 序号序号xyx2y2xy1969892169604940829910098011000099003104108108161166
11、4112324969792169409931259493883686498742合计 489496478854932648594(4)计算样本协方差.85 221 3151xyxySPsn .4894964859485 2xyxyxySP 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计20 xyxySPrSSSSyxnxySPxy1221xnxSSx221ynySSy校正的叉积和x的离差平方和y的离差平方和由离差平方和由离差平方和计算相关系数计算相关系数(5)计算样本相关系数样本相关系数3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计2
12、1最后计算次计算xyxy2x2y先计算yxnxySPxy1221xnxSSx221ynySSy校正的叉积和x的离差平方和y的离差平方和yxxySSSSSPr(5)计算样本相关系数3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计22 221xxxxnsn 1xyxyxynsn xyxyxyxxyySPsrSSSSss 221yyyynsn 协方差由协方差计由协方差计算相关系数算相关系数(5)计算样本相关系数或 的样本方差3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计23111xyxyxyxyyxxyyxSPSPsnrSSSSSSssSSn
13、n (5)计算样本相关系数样本相关系数样本方差样本协方差3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计24xy 48594x 489y 496x 247885y 249326(5)计算样本相关系数序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 4894964788549326485943.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计25.xySPxyxyn 11485944
14、89 49685 205计算 与 的校正叉积和(5)计算样本相关系数xy 48594x 489y 496x 247885y 2493263.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计26 .xSSxxn 222114788548960 805计算 的离差平方和(5)计算样本相关系数xy 48594x 489y 496x 247885y 2493263.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计27 .ySSyyn 2221149326496122 805计算 的离差平方和(5)计算样本相关系数xy 48594x 489y 496x 2
15、47885y 2493263.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计28.xyxySPrSSSS 85 20 986060 8 122 8(5)计算样本相关系数序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 4894964788549326485943.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计29(6)计算样本偏度Skewness 33333XEXVarXEXE总体
16、的偏度或偏斜系数定义如下:偏度或偏度系数是三阶中心矩与标准差三次方之比中心偏差三次方的期望与标准差三次方之比3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计30正态分布的偏度或偏斜系数为:(6)计算样本偏度Skewness333330E XE XE XVar X3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计31 333332331111111xxxxxnnsxxnxxnSS (6)计算样本偏度Skewness的样本偏度计算:3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计32 33312xxnnns 的样本偏
17、度计算:(6)计算样本偏度Skewness3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计33 .3173 52xx 序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594x的离差三次方和(6)计算样本偏度Skewness.97 8x 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计34247885489xx 序号序号xyx2y2xy196
18、98921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594 .22247885489 560 80 xSSxxn (6)计算样本偏度Skewnessx的离差平方和3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计35 .222247885489 515 2151xxnsn 序号序号xyx2y2xy196989216960494082991009801100009900310410810816116641
19、12324969792169409931259493883686498742合计 489496478854932648594(6)计算样本偏度Skewness.260 815 2151xSSsn3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计36序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594均值右侧数据较分散(6)计算样本偏度Skewness .3333125
20、173 524 315 21 2200368xxnnns 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计37(7)计算样本峰度Kurtosis4444433E XE XE XVar X总体的峰度或峰突系数的定义如下:峰度或峰突系数是:4阶中心矩与标准差4次方之比再减3;中心偏差4次方的期望与标准差4次方之比再减3。3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计38(7)计算样本峰度Kurtosis正态分布的峰度或峰突系数为 033334444444XEXVarXEXE3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_
21、描述统计39(7)计算样本峰度Kurtosis的样本峰度计算:444442441113311113xxxxxnnsxxnxxnSS 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计40 444211233123xxn nnnnsnnn 的样本峰度计算:(7)计算样本峰度Kurtosis3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计41序号序号xyx2y2xy1969892169604940829910098011000099003104108108161166411232496979216940993125949388368649874
22、2合计 489496478854932648594 .41709 216xx x的离差四次方和(7)计算样本峰度Kurtosis.97 8x 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计42247885489xx 序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594 .22247885489 560 80 xSSxxn x的离差平方和(7)计算样本峰度Kurto
23、sis3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计43 .222247885489 515 2151xxnsn 序号序号xyx2y2xy19698921696049408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594(7)计算样本峰度Kurtosis.260 815 2151xSSsn3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计44序号序号xyx2y2xy1969892169604
24、9408299100980110000990031041081081611664112324969792169409931259493883686498742合计 489496478854932648594略低于正态分布(7)计算样本峰度Kurtosis .444222112331235 61709 2163 44 3 215 23 21 2474030 xxn nnnnsnnn 3.4 基于观测的统计计算2022-11-26王玉顺:数理统计03_描述统计453.5 基于频数的统计计算Statistic Calculating based Frequency Distribution3 描述统
25、计2022-11-26王玉顺:数理统计03_描述统计46引言3.5 基于频数的统计计算 基于频数的统计计算,先利用抽样获得的n个样本观察值样本观察值(observation)x,x,x 做出频数分布表,再利用该表的组中值(或观测)和频数数据计算均值、方差、标准差、变异系数、偏度和峰度等统统计量观察值计量观察值(statistic observation)。2022-11-26王玉顺:数理统计03_描述统计47 .nn xxn xxxn xn 2000 41 1810 176417643 82200(1)计算样本均值样本值频数频率xn(x)fn(x)040.0201180.0902310.155
26、3410.2054380.1905290.1456210.1057100.050850.025920.0101010.0053.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计48 .nxx n xnn xxnxfx 10 0 021 0 0910 0 0053 82样本值频数频率xn(x)fn(x)040.0201180.0902310.1553410.2054380.1905290.1456210.1057100.050850.025920.0101010.005(1)计算样本均值3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计49 .x
27、n x 45 5 149 0 573 5 35883 5组中值频数频率xn(x)fn(x)45.510.0149.050.0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03 .nxfx 45 5 0 0149 0 0 0573 5 0 0358 835 nn x 100(1)计算样本均值3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计50 .xxn xn 15883 558 835100 .nxxfx 58 835组中值频数频率xn(x)fn(x)45.510.0149.050.
28、0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03(1)计算样本均值3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计51(2)计算样本方差和标准差样本值频数频率xn(x)fn(x)040.0201180.0902310.1553410.2054380.1905290.1456210.1057100.050850.025920.0101010.005 .222222241812000411810136720 41 1810 1764113672764753 52200 xnn xx
29、 n xxn xSSx n xxn xn 3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计52样本值频数频率xn(x)fn(x)040.0201180.0902310.1553410.2054380.1905290.1456210.1057100.050850.025920.0101010.005 .22222211113672764 2003 78652001753 523 786512001xsxxn xnx n xxn xnnSSsn (2)计算样本方差和标准差.s 194593.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计53组中
30、值频数频率xn(x)fn(x)45.510.0149.050.0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03 .222222215310045 5149 0573 53348990 2545 5 149 0 573 5 35883 511348990 255883 51002834 5275xnn xx n xxn xSSx n xxn xn (2)计算样本方差和标准差3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计54组中值频数频率xn(x)fn(x)45.510.0149
31、.050.0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03(2)计算样本方差和标准差.ss 253508 .22222111348990 255883 5100100128 631592834 527528 6315911001xx n xxn xnsnSSsn 3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计55.vscx 1001 94591003 8250 94(3)计算变异系数样本值频数频率xn(x)fn(x)040.0201180.0902310.1553410.20
32、54380.1905290.1456210.1057100.050850.025920.0101010.0053.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计56.1005 3508510058 8359 0947vscx 组中值频数频率xn(x)fn(x)45.510.0149.050.0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03(3)计算变异系数3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计57(4)计算样本偏度 33312n xxxnnn
33、s 的样本偏度()计算3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计58样本值频数频率xn(x)fn(x)040.0201180.0902310.1553410.2054380.1905290.1456210.1057100.050850.025920.0101010.005(4)计算样本偏度 .23333333 7865327630 067212200630 0672199 1983 78653270 4340463smn xxxn xxxnnns 右偏3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计59组中值频数频率xn(x)fn(
34、x)45.510.0149.050.0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03(4)计算样本偏度 .233333328631595898665325012100589866532599 98286315903968481smn xxxn xxxnnns 右偏3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计60(5)计算样本峰度的样本峰度()计算 444211233123n xxxn nnnnsnnn 3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述
35、统计61样本值频数频率xn(x)fn(x)040.0201180.0902310.1553410.2054380.1905290.1456210.1057100.050850.025920.0101010.005(5)计算样本峰度 .244444222378653278326954144011233123200 201832695414403 199199 198 19737865327198 19700379943smn xx xn xx xn nnnnsnnn 略高于正态分布3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计62组中值频数频率xn(x)fn(x)4
36、5.510.0149.050.0552.5110.1156.0230.2359.5350.3563.0130.1366.570.0770.020.0273.530.03(5)计算样本峰度 .2444442222863159295519587427311233123100 10129551958742733 9999 98 97286315998 9707757668smn xx xn xx xn nnnnsnnn 略低于正态分布3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计63(6)关于协方差和相关系数 协方差和相关系数表征两变量的线性相关关系,由于两变量是在相同
37、条件下成对观测的,而且一般尺度也不同,故它们各自统计的频数分布已破坏了两变量的相关关系。因此,不存在“基于频数的协方差计算和相关系数计算”。计算协方差和相关系数,采用基于样本观测的算法。3.5 基于频数的统计计算2022-11-26王玉顺:数理统计03_描述统计643.6本章小结Summarization3 描述统计2022-11-26王玉顺:数理统计03_描述统计653.6 本章小结离散样本的频数频率分布表样本值频数累积频数频率累积频率0440.0200.020118220.0900.110231530.1550.265341940.2050.4704381320.1900.66052916
38、10.1450.8056211820.1050.9107101920.0500.960851970.0250.985921990.0100.9951012000.0051.000(1)离散样本的频数频率统计2022-11-26王玉顺:数理统计03_描述统计663.6 本章小结(1)离散样本的频数频率统计离散样本频数分布柱形图2022-11-26王玉顺:数理统计03_描述统计673.6 本章小结离散样本频率分布柱形图(1)离散样本的频数频率统计2022-11-26王玉顺:数理统计03_描述统计683.6 本章小结组序组区间组中值频数累积频数频率累积频率143.75,47.25)45.5110.0
39、10.01247.25,50.75)49.0560.050.06350.75,54.25)52.511170.110.17454.25,57.75)56.023400.230.40557.75,61.25)59.535750.350.75661.25,64.75)63.013880.130.88764.75,68.25)66.57950.070.95868.25,71.75)70.02970.020.97971.75,75.25)73.531000.031.00连续样本的频数频率分布表(2)连续样本的频数频率统计2022-11-26王玉顺:数理统计03_描述统计693.6 本章小结(2)连续样
40、本的频数频率统计连续样本频数分布直方图2022-11-26王玉顺:数理统计03_描述统计703.6 本章小结(2)连续样本的频数频率统计连续样本频率分布直方图2022-11-26王玉顺:数理统计03_描述统计713.6 本章小结(3)数据预处理xyxy2x2y先计算 x n x 2xn x先计算ni 1基于观测的计算kj 1基于频数的计算2022-11-26王玉顺:数理统计03_描述统计723.6 本章小结(3)数据预处理ni 1基于观测的计算kj 1基于频数的计算 2222111xyxySSxxnSSyynSPxyxyn 221xSSxn xx n xn2022-11-26王玉顺:数理统计0
41、3_描述统计73xnx1 1xxn xn3.6 本章小结kj 1ni 1(4)样本均值的计算基于观测的计算基于频数的计算2022-11-26王玉顺:数理统计03_描述统计7422211xxxnSSsnn 222111xx n xxn xSSnsnn3.6 本章小结x2x先计算ni 1(5)样本方差的计算kj 1基于观测的计算基于频数的计算2022-11-26王玉顺:数理统计03_描述统计75100 xscv3.6 本章小结(6)样本变异系数的计算2022-11-26王玉顺:数理统计03_描述统计76 111xyxyxyxySPnsnn3.6 本章小结xyxy先计算ni 1(7)样本协方差的计算基于观测的计算2022-11-26王玉顺:数理统计03_描述统计773.6 本章小结最后计算次计算xyxy2x2y先计算yxnxySPxy1221xnxSSx221ynySSy校正的叉积和x的离差平方和y的离差平方和yxxySSSSSPrni 1(8)样本相关系数的计算2022-11-26王玉顺:数理统计03_描述统计78结束结束