1、1例例1 已知一个家庭已知一个家庭3个孩子,且其中一个是女孩。假设一个小孩是男是女的概率相同,个孩子,且其中一个是女孩。假设一个小孩是男是女的概率相同,求该家庭中至少有一个男孩的概率求该家庭中至少有一个男孩的概率 .男男男男男男 男男女男男女 男女男男女男 女男男女男男 男女女男女女 女男女女男女 女女男女女男 女女女女女女6/7 2例例2 某人抛某人抛10次均匀的硬币,次均匀的硬币,10次国徽向上的概率次国徽向上的概率=.如果前如果前9次都是国徽向上,第次都是国徽向上,第10次国徽向上的概率次国徽向上的概率=.0.510 0.5一项化验有一项化验有95%的把握把患某疾病的人鉴别出来;但对健康
2、人也有的把握把患某疾病的人鉴别出来;但对健康人也有1%可能出现假可能出现假阳性。若此病的发病率为阳性。若此病的发病率为0.5%,求当某人化验阳性时,他患病的概率是多少?,求当某人化验阳性时,他患病的概率是多少?A:患病;:患病;B:检查阳性:检查阳性 3例例3()0.5%()95%()1%P AP B AP B A()P B()P ABAB()()P ABP AB()()()()0.5%95%99.5%1%P A P B AP A P B A一项化验有一项化验有95%的把握把患某疾病的人鉴别出来;但对健康人也有的把握把患某疾病的人鉴别出来;但对健康人也有1%可能出现假可能出现假阳性。若此病的发
3、病率为阳性。若此病的发病率为0.5%,求当某人化验阳性时,他患病的概率是多少?,求当某人化验阳性时,他患病的概率是多少?A:患病;:患病;B:检查阳性:检查阳性 4例例3()()()0.5%95%99.5%1%P BP ABP AB0.5%95%()0.5%95%99.5%1%P A B 5第第2章章|2.1分布分布l离散:两点离散:两点B(1,p)二项二项B(n,p)泊松泊松P()l连续:均匀连续:均匀U(a,b)正态正态N(,2)指数指数l分布函数分布函数F(x)=P(Xx)标准正态分布的分布函数标准正态分布的分布函数(x)6例例4.1 设计一个实验用于检验一种药物在设计一个实验用于检验一
4、种药物在20只老鼠身上的效力。先前的研究表明,只老鼠身上的效力。先前的研究表明,10mg的的药在头药在头4个小时内可致死个小时内可致死5%的老鼠;在头的老鼠;在头4个小时仍存活的老鼠,在接下去的个小时仍存活的老鼠,在接下去的4小时内小时内死亡死亡10%.(1)在头)在头4个小时内至少死亡个小时内至少死亡3只老鼠的概率是多少?只老鼠的概率是多少?(20,0.05)XB(3)P X 1(0)(1)(2)P XP XP X22020010.05 0.95iiiiC 7例例4.2 设计一个实验用于检验一种药物在设计一个实验用于检验一种药物在20只老鼠身上的效力。先前的研究表明,只老鼠身上的效力。先前的
5、研究表明,10mg的的药在头药在头4个小时内可致死个小时内可致死5%的老鼠;在头的老鼠;在头4个小时仍存活的老鼠,在接下去的个小时仍存活的老鼠,在接下去的4小时内小时内死亡死亡10%.(2)假设在头)假设在头4个小时内有个小时内有2只死亡,计算在后只死亡,计算在后4个小时内死亡数不超过个小时内死亡数不超过2只的概率;只的概率;18(18,0.1)YB18(2)P Y 2181800.1 0.9iiiiC 8例例4.3 设计一个实验用于检验一种药物在设计一个实验用于检验一种药物在20只老鼠身上的效力。先前的研究表明,只老鼠身上的效力。先前的研究表明,10mg的的药在头药在头4个小时内可致死个小时
6、内可致死5%的老鼠;在头的老鼠;在头4个小时仍存活的老鼠,在接下去的个小时仍存活的老鼠,在接下去的4小时内小时内死亡死亡10%.(3)计算在)计算在8个小时内无一死亡的概率个小时内无一死亡的概率.20200.95 0.900.436 9例例5 随机变量随机变量X 服从正态分布服从正态分布N(,2),随,随的增大,概率的增大,概率P(|X|)().(A)单调增加;)单调增加;(B)单调减少;)单调减少;(C)保持不变;)保持不变;(D)增减不定。)增减不定。()()P XPX()()P XP X()()(1)(1)C 00()=xP Xx 10例例6.1已知某疾病患者自然痊愈率为已知某疾病患者自
7、然痊愈率为0.2,为了鉴定一种新药是否有效,医生把它给,为了鉴定一种新药是否有效,医生把它给10个个病人服用。事先规定一个决策规则:若病人服用。事先规定一个决策规则:若10个病人中至少有个病人中至少有4个治愈,就认为该药个治愈,就认为该药有效;反之,则认为该药无效。求有效;反之,则认为该药无效。求:(1)虽然新药有效并把治愈率提高到)虽然新药有效并把治愈率提高到0.3,但通过试验却被否定的概率;,但通过试验却被否定的概率;(4=0.3)P Xp 3101000.3 0.70.65iiiiC 11例例6.2已知某疾病患者自然痊愈率为已知某疾病患者自然痊愈率为0.2,为了鉴定一种新药是否有效,医生
8、把它给,为了鉴定一种新药是否有效,医生把它给10个病人服用。事先规定一个决策规则:若个病人服用。事先规定一个决策规则:若10个病人中至少有个病人中至少有4个治愈,就认为该个治愈,就认为该药有效;反之,则认为该药无效。求药有效;反之,则认为该药无效。求:(2)新药完全无效,但通过试验却被认为有效的概率。)新药完全无效,但通过试验却被认为有效的概率。(4=0.2)P Xp 31010010.2 0.80.12iiiiC 12第第2章章|2.2数字特征数字特征l期望期望l方差,标准差方差,标准差l变异系数变异系数l分位数分位数Xp:-()()diiE Xx pxf xx 222()()()()D X
9、E XE XE XE X()()D XCVE X()pP XXp13例例714第第2章章|2.3大数定律与中心极限定理大数定律与中心极限定理大数定律:样本均值趋近于总体期望大数定律:样本均值趋近于总体期望.中心极限定理:大量独立的随机变量的和的分布趋近于正态分布中心极限定理:大量独立的随机变量的和的分布趋近于正态分布.2111(,)nnnnkkkkkkXN2111()(,)(,(1)nniinXXXNnnXB n pXN np nppmsms=-,15第第3章章|3.1统计量统计量11niixxn 22221111()11()nniiiisnxxxnnxl2分布:分布:lt分布分布lF分布分布
10、16第第3章章|3.2抽样分布抽样分布222(0,1)(1)(1)(1)XNnXt nSnnSn 17第第3章章|3.2抽样分布抽样分布22112222122212(1,1)()()(2)(1)(1)11(1)(1)SF mnSXYt mnmSnSmnmn 18第第3章章|3.3估计估计l点估计:点估计:无无偏、偏、有有效效22()()()E XE SXEpn 19第第3章章|3.3估计估计l区间估计:可靠性区间估计:可靠性1,精度,精度正态分布均值正态分布均值:A.已知;已知;B.未知未知正态分布方差正态分布方差2:二项分布的二项分布的p:20第第3章章|3.4假设检验基本概念假设检验基本概
11、念l零假设(原假设)零假设(原假设)vs 备择假设(对立假设)备择假设(对立假设)l显著性水平(检验水平)显著性水平(检验水平)vs 功效功效l接受域接受域 vs 拒绝域拒绝域l第一类错误第一类错误 vs 第二类错误第二类错误l临界值法、置信区间法、临界值法、置信区间法、P值法值法正态正态21第第3章章|3.5定量资料的检验定量资料的检验|单样本单样本单样本与理论值比较单样本与理论值比较单样本单样本u u检验、单样本检验、单样本t t检验检验符号检验、符号秩检验符号检验、符号秩检验(中位数与理论值的比较)(中位数与理论值的比较)非正态非正态大样本大样本大样本大样本非正态非正态22第第3章章|3
12、.5定量资料的检验定量资料的检验|两组样本比较两组样本比较两组样本均值比较两组样本均值比较配对配对t 检验检验Wilcoxon秩和检验秩和检验配对配对成组成组符号检验、符号秩检验符号检验、符号秩检验成组成组t或或t检验检验正态正态非正态非正态正态正态大样本大样本非正态非正态方差不齐方差不齐23第第3章章|3.5定量资料的检验定量资料的检验|多组比较多组比较多组样本均值的比较多组样本均值的比较完全随机设计完全随机设计方差分析方差分析多重比较:多重比较:LSD法、法、Duncan法法Newman-Q法法秩和检验秩和检验正态正态方差齐性方差齐性24第第3章章|3.5定量资料的检验定量资料的检验单样本
13、与总体均数的比较单样本与总体均数的比较 单一样本单一样本u检验、检验、t检验检验两组配对样本均数的比较两组配对样本均数的比较 配对配对t检验检验 符号检验符号检验两组独立样本均数的比较两组独立样本均数的比较 方差齐性方差齐性 F检验检验+成组成组t或或t检验检验 秩和检验秩和检验多组独立样本均数的比较多组独立样本均数的比较 方差分析方差分析 Wicoxon秩和检验秩和检验25第第3章章|3.6定性资料的检验定性资料的检验l拟合优度的检验拟合优度的检验l列联表的检验列联表的检验2221()(1)riiiiOTrmT 22211.222(1)(1)(1)(|0.5)(1)()()()()rciji
14、jijOnrcOOn adbcnab cdac bd 26第第3章章|3.7离散分布的假设检验离散分布的假设检验l单个二项分布(小样本):单个二项分布(小样本):P值法值法l单个二项分布(大样本):正态近似单个二项分布(大样本):正态近似l两个二项分布(大样本):两个二项分布(大样本):正态近似正态近似U检验检验=22列联表列联表2检验检验lk个二项分布(大样本):个二项分布(大样本):k2列联表列联表2检验检验27假设检验中需注意的几个问题假设检验中需注意的几个问题l“假设假设”是对是对总体特征总体特征的表述的表述 l各种检验方法以统计量的分布命名各种检验方法以统计量的分布命名S:拒绝原假设
15、,结论为拒绝原假设,结论为3.7.T:good!28对话对话12.43.7=2.291.96328u 0:3.7:3.7AHH2832.4nx S:But,如果我的原假设为,如果我的原假设为T:o()o不要啊不要啊S:拒绝原假设,结论就为拒绝原假设,结论就为=3.7.?_?T:29对话对话1(Cont.)2.43.7=2.291.96328u 0:3.7:3.7AHH30T(很挣扎地):你为什么在假设(很挣扎地):你为什么在假设下用下用这个统计量?这个统计量?S:书上这么写的,:书上这么写的,T也是这么教的也是这么教的T:偶有这样教么:偶有这样教么对话对话1(Cont.)2.43.7=2.29
16、1.96328u 0:3.7:3.7AHH31原假设的作用原假设的作用假设假设=3.7=3.7成立成立概率小于概率小于=0.05的事件为小概率事件。的事件为小概率事件。?事件事件 为小概率事件为小概率事件?2(,3)(0,1)328XNXN 3.7(0,1)328XN 3.71.96328XU 32原假设的作用原假设的作用lH0与与HA并非平等并列,而是以并非平等并列,而是以H0为主。为主。检验统计量与检验统计量与H0密切相关密切相关 检验检验统计量的概率分布是在统计量的概率分布是在H0条件下产生条件下产生的。的。S:如果我的假设为:如果我的假设为拒绝原假设,结论为拒绝原假设,结论为3.7.T
17、:(o )33对话对话22.43.72.29328u 0:3.7:3.7AHH(2.29)0.011PP U S:ButT:(o )?S:拒绝原假设,结论就为拒绝原假设,结论就为3.7.?_?T:34对话对话2(Cont.)0:3.7:3.7AHH2.43.72.29328u (2.29)0.011PP U 0:3.7:3.7AHH 原假设和备择假设的确定原假设和备择假设的确定2.4x 0:3.7:3.7AHH0:3.7:3.7AHH36备择假设的作用:确定不利于原假设的范围备择假设的作用:确定不利于原假设的范围2.4x 0.052.43.72.291.64328uu 0:3.7:3.7AHH
18、H0:=3.7 X3.73.7HA:3.7(2.4)(2.29)0.989PP XP U 38例例6.1已知某疾病患者自然痊愈率为已知某疾病患者自然痊愈率为0.2,为了鉴定一种新药是否有效,医生把它给,为了鉴定一种新药是否有效,医生把它给10个个病人服用。事先规定一个决策规则:若病人服用。事先规定一个决策规则:若10个病人中至少有个病人中至少有4个治愈,就认为该药个治愈,就认为该药有效;反之,则认为该药无效。有效;反之,则认为该药无效。0:0.2:0.2AHpHp39例例6.1已知某疾病患者自然痊愈率为已知某疾病患者自然痊愈率为0.2,为了鉴定一种新药是否有效,医生把它给,为了鉴定一种新药是否
19、有效,医生把它给10个个病人服用。事先规定一个决策规则:若病人服用。事先规定一个决策规则:若10个病人中至少有个病人中至少有4个治愈,就认为该药个治愈,就认为该药有效;反之,则认为该药无效。求有效;反之,则认为该药无效。求:(1)虽然新药有效并把治愈率提高到)虽然新药有效并把治愈率提高到0.3,但通过试验却被否定的概率;,但通过试验却被否定的概率;(4=0.3)P Xp 3101000.3 0.70.65iiiiC 0()AP HH40例例6.2已知某疾病患者自然痊愈率为已知某疾病患者自然痊愈率为0.2,为了鉴定一种新药是否有效,医生把它给,为了鉴定一种新药是否有效,医生把它给10个病人服用。
20、事先规定一个决策规则:若个病人服用。事先规定一个决策规则:若10个病人中至少有个病人中至少有4个治愈,就认为该个治愈,就认为该药有效;反之,则认为该药无效。求药有效;反之,则认为该药无效。求:(2)新药完全无效,但通过试验却被认为有效的概率。)新药完全无效,但通过试验却被认为有效的概率。(4=0.2)P Xp 31010010.2 0.80.12iiiiC 0()AP HH例例7例例8例例8.18.1(1)基线检查:)基线检查:两组两组治疗前治疗前数据的比较数据的比较a.两组两组治疗前治疗前数据是否正态数据是否正态b.两组两组治疗前治疗前数据数据的方差是否齐性的方差是否齐性满足满足a、b:治疗
21、前治疗前数据做成组数据做成组t检验,检验,满足满足a:治疗前治疗前数据做数据做成组成组t检验检验不能满足不能满足a、b:治疗前治疗前数据做数据做秩和检验秩和检验例例8.1 两组疗前的方差齐性检验两组疗前的方差齐性检验例例8.1 两组疗前的成组两组疗前的成组t检验检验例例8.28.2(2)两组)两组分别分别作作疗效疗效(=疗后疗前疗后疗前)检验)检验a.分别检查两组分别检查两组疗效疗效是否服从正态分布是否服从正态分布差值正态:差值正态:治疗前后的数据的差做治疗前后的数据的差做配对配对t检验检验差值不正态:差值不正态:治疗前后的数据的差做治疗前后的数据的差做符号检验符号检验 或符号秩检验或符号秩检
22、验例例8.2 甲组疗效的检验:配对甲组疗效的检验:配对t检验检验例例8.2 乙组疗效的检验:配对乙组疗效的检验:配对t检验检验例例8.38.3(3)两组)两组疗效疗效(=疗后疗前)的比较疗后疗前)的比较a.分别检查两组的分别检查两组的疗效疗效是否服从正态分布是否服从正态分布b.检查两组检查两组疗效疗效的方差是否齐性的方差是否齐性满足满足a、b:两组的:两组的疗效疗效做成组做成组t检验,检验,满足满足a:两组的:两组的疗效疗效做成组做成组t检验检验不能满足不能满足a、b:两组的:两组的疗效疗效做秩和检验做秩和检验例例8.3 两组疗效的方差齐性两组疗效的方差齐性F检验检验例例8.3 两组疗效的成组
23、两组疗效的成组t检验检验52例例9要研究某个医院的某一疾病患者住院日的长短要研究某个医院的某一疾病患者住院日的长短:46 27 10 68 87 76 125 60 35 73 96 44 2380:40H 中中位位数数n=13,n=3,nB(n,p)单个小样本二项分布参数的检验单个小样本二项分布参数的检验53例例9 A0:40H 中中位位数数46 27 10 68 87 76 125 60 35 73 96 44 238 0:0.5Hp30.2313p 54例例9 B0:40H 中中位位数数46 27 10 68 87 76 125 60 35 73 96 44 238 0:0.5Hp符号检
24、验:符号检验:Smin(n,n)min(10,3)3附表附表C12(P453):S0.052S30.05水平上不拒绝原假设水平上不拒绝原假设H0,住院日中位数为住院日中位数为40.1628.6%:(0.177,0.422)56pp某公司开发部门举办一次特别调查以检验市场上甲、乙两种啤酒哪种更受欢迎。邀某公司开发部门举办一次特别调查以检验市场上甲、乙两种啤酒哪种更受欢迎。邀请请70位消费者品尝评价味道好坏,结果:位消费者品尝评价味道好坏,结果:40位消费者认为甲啤酒优于乙啤酒位消费者认为甲啤酒优于乙啤酒16位消费者认为乙啤酒优于甲啤酒位消费者认为乙啤酒优于甲啤酒14位消费者则认为两种啤酒不相上下
25、位消费者则认为两种啤酒不相上下试判断两种啤酒是否有差异。试判断两种啤酒是否有差异。55例例10.140n 16n 401656n 112.5%:(0.003,0.483)8pp某公司开发部门举办一次特别调查以检验市场上甲、乙两种啤酒哪种更受欢迎。邀某公司开发部门举办一次特别调查以检验市场上甲、乙两种啤酒哪种更受欢迎。邀请请70位消费者品尝评价味道好坏,结果:位消费者品尝评价味道好坏,结果:8位消费者认为甲啤酒优于乙啤酒位消费者认为甲啤酒优于乙啤酒1位消费者认为乙啤酒优于甲啤酒位消费者认为乙啤酒优于甲啤酒61位消费者则认为两种啤酒不相上下位消费者则认为两种啤酒不相上下试判断两种啤酒是否有差异。试
26、判断两种啤酒是否有差异。56例例10.28n 1n 9n 57第第4章章 方差分析方差分析方差分析的解决的问题方差分析的解决的问题 多组均值的比较多组均值的比较方差分析的基本思想:方差分析的基本思想:分解离差平方和,分解离差平方和,T=e+A方差分析的前提方差分析的前提 正态、方差齐性、独立正态、方差齐性、独立方差分析的模型方差分析的模型 多重比较多重比较2(0,)ijiijiijijxN58例例11某医院妇产科测定几种卵巢功能异常患者血清中促黄体素的某医院妇产科测定几种卵巢功能异常患者血清中促黄体素的含量含量(U/L),结果如下:,结果如下:卵巢发育不良:卵巢发育不良:42.50 38.31
27、 35.76 33.60 31.38丘脑性闭经:丘脑性闭经:6.71 3.32 4.59 1.67 10.51 2.96 11.82 3.86 8.26 2.63 2.20垂体性闭经:垂体性闭经:4.50 2.75 11.14 5.98 1.90 5.43 11.05 22.03研究者运用研究者运用t 检验进行两两比较,共比较了检验进行两两比较,共比较了3 次。结论是卵巢次。结论是卵巢发育不良者血清中促黄体素的含量高于丘脑性闭经和垂体性发育不良者血清中促黄体素的含量高于丘脑性闭经和垂体性闭经者。这样做是否妥当?为什么?正确的做法是什么?闭经者。这样做是否妥当?为什么?正确的做法是什么?(无无需
28、计算结果需计算结果)59第第5章章 相关回归相关回归相关系数的含义及其计算、检验相关系数的含义及其计算、检验线性回归模型、回归方程的含义线性回归模型、回归方程的含义回归分析:回归分析:最小二乘原则(最小二乘原则(LSE)估计回归方程参数:)估计回归方程参数:、2 回归方程:回归方程:y=a+bx 检验回归方程:检验回归方程:H0:=0决定系数决定系数R260第第5章章|关于回归方程的检验关于回归方程的检验00:0:0HH22(2)(1,2)2(2)1.10exxRebtt nMSSMSFtFnMSr ntt nrC 附附表表61例例122y a bxx ab yrbb y a bxx ab y
29、aybxaxby 62统计学发展史统计学发展史a a统计学的历史可以追溯到两千三百多年前的古希腊统计学的历史可以追溯到两千三百多年前的古希腊亚里士多德时代。但许多学者以约翰亚里士多德时代。但许多学者以约翰格朗特(格朗特(John Graunt)1663年发表的年发表的死亡率之自然政治观测死亡率之自然政治观测作为统计的起源。作为统计的起源。17世纪,为了税收和征兵的需要,欧洲各国开始收世纪,为了税收和征兵的需要,欧洲各国开始收集人口统计学资料。与此同时,随着商业的兴起,集人口统计学资料。与此同时,随着商业的兴起,为减少海难等意外造成的经济损失,精算和保险业为减少海难等意外造成的经济损失,精算和保
30、险业产生了。产生了。统计学理论的主要发展是在统计学理论的主要发展是在19世纪末世纪末20世纪初开始,世纪初开始,20世纪世纪40年代逐渐成熟。年代逐渐成熟。高尔顿开创了回归分析的研究,他的研究解释了为高尔顿开创了回归分析的研究,他的研究解释了为什么人类的身高没有无止境地长高或变矮。随后,什么人类的身高没有无止境地长高或变矮。随后,相关系数、中位数、标准差等概念被引入统计。相关系数、中位数、标准差等概念被引入统计。63统计学发展史统计学发展史b b1900年,卡尔年,卡尔皮尔逊发展了卡方检验,开创了统计皮尔逊发展了卡方检验,开创了统计模型假设严格的科学检验。模型假设严格的科学检验。1911年,皮
31、尔逊在英国伦敦大学建立了世界上第一年,皮尔逊在英国伦敦大学建立了世界上第一个统计系。个统计系。接下来,罗纳德接下来,罗纳德费歇尔(费歇尔(Ronald Fisher)创建了很)创建了很多现代统计学的理论基础,包括现在每天被科学家多现代统计学的理论基础,包括现在每天被科学家们使用成千上万次的方差分析、极大似然估计、许们使用成千上万次的方差分析、极大似然估计、许多样本统计量的精确分布、小样本统计方法、最优多样本统计量的精确分布、小样本统计方法、最优估计和检验程序。受农业田间实验的启发,他建立估计和检验程序。受农业田间实验的启发,他建立发展了试验设计的主要思想。发展了试验设计的主要思想。64统计学发
32、展史统计学发展史c c20世纪中期,美国的统计学家做出了许多开创性的世纪中期,美国的统计学家做出了许多开创性的工作。统计学在美国作为一门独立学科开始制度化工作。统计学在美国作为一门独立学科开始制度化和系统化,纷纷从数学系中独立出来。和系统化,纷纷从数学系中独立出来。概率论为统计学的发展奠定了必需的基础。大样本概率论为统计学的发展奠定了必需的基础。大样本理论为统计学家提供了统计量未知分布的精确估计。理论为统计学家提供了统计量未知分布的精确估计。至今已有至今已有4位学者因发展统计方法在经济学中的应用位学者因发展统计方法在经济学中的应用而获得诺贝尔经济学奖。而获得诺贝尔经济学奖。65考场安排考场安排661月月4日日 9:0011:00,13:3015:301月月6日日 9:0011: 答疑安排答疑安排67单样本问题单样本问题68两样本问题两样本问题69多样本问题多样本问题70统计方法统计方法