[管理学]第3章定性数据的卡方检验课件.ppt

上传人(卖家):三亚风情 文档编号:2891623 上传时间:2022-06-08 格式:PPT 页数:62 大小:1.30MB
下载 相关 举报
[管理学]第3章定性数据的卡方检验课件.ppt_第1页
第1页 / 共62页
[管理学]第3章定性数据的卡方检验课件.ppt_第2页
第2页 / 共62页
[管理学]第3章定性数据的卡方检验课件.ppt_第3页
第3页 / 共62页
[管理学]第3章定性数据的卡方检验课件.ppt_第4页
第4页 / 共62页
[管理学]第3章定性数据的卡方检验课件.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

1、第三章第三章定性数据的卡方检验在各个研究领域中,有些研究问题只能划分为不同在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、男女,职业分为公务员、教师、工人、,教师,教师职称又分为教授、副教授、职称又分为教授、副教授、。有时虽有量的关。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢只是研

2、究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。关性方法称为计数数据统计方法。 机动 目录 上页 下页 返回 结束 H0(无效假设):总体参数没有差别(无效假设):总体参数没有差别机动 目录 上页 下页 返回 结束 2检验检验用途:分类计数资料的假设检验,检验两个或多个用途:分类计数资料的假设检验,检验两个或多个总体率或构成比有无差别。总体率或构成比有无差别。基本思想:实际频数与理论频数的符合程度,即

3、差基本思想:实际频数与理论频数的符合程度,即差别是否由抽样误差引起的。别是否由抽样误差引起的。检验统计量:检验统计量:) 1()(2202rKfffee2用来反映各类中实际观测到的实际频数与一定假用来反映各类中实际观测到的实际频数与一定假设下的理论频数的偏离程度设下的理论频数的偏离程度. 永远是正值永远是正值.实际频数通过实际观测或实验得到实际频数通过实际观测或实验得到, 理论频数要按理论频数要按照统计假设计算出来照统计假设计算出来. 第三章 第一节第一节机动 目录 上页 下页 返回 结束 卡方拟合性检验 第三章 第一节第一节机动 目录 上页 下页 返回 结束 卡方拟合性检验一、卡方检验的一般

4、问题一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的布不作任何假设,因此它又是非参数检验法中的一种。一种。理论证明,实际观察次数(理论证明,实际观察次数(fo)与理论次数()与理论次数(fe),),又称期望次数)之差的平方再除以理论次数所得又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:的统计量,近似服从卡方分布,可表示为: 机动 目录 上页 下页 返回 结束 ) 1()(2202rKfffeeK为组数为组数, r为待估参数个数为待估参数个数.n=1n=4n=1

5、0f(y)0 1 3 5 7 9 11 13 15 17 x0.50.40.30.20.1有所改变有所改变. .2分布的概率密度图形如下:分布的概率密度图形如下:2显然显然分布的概率密度图形分布的概率密度图形随自由度的不同而随自由度的不同而当当fe越大(越大( fe 5), 近似得越好。近似得越好。 显然显然fo与与fe相差越大,卡方值就越大;相差越大,卡方值就越大; fo与与fe相差越小,相差越小,卡方值就越小;因此它能够用来表示卡方值就越小;因此它能够用来表示fo与与fe相差的程相差的程度。度。 机动 目录 上页 下页 返回 结束 拟合性检验自由度的确定与两个因素有关:一是分拟合性检验自由

6、度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时,所用统计量或类的项数,二是在计算理论次数时,所用统计量或约束条件的个数,这两者之差即为自由度。约束条件的个数,这两者之差即为自由度。 由于一般情况下,计算理论次数时只用到由于一般情况下,计算理论次数时只用到“总数总数”这一统计量,所以自由度一般是分类的项数减这一统计量,所以自由度一般是分类的项数减1。 拟合性检验的零假设是观测次数与理论次数之间无拟合性检验的零假设是观测次数与理论次数之间无差异。差异。 机动 目录 上页 下页 返回 结束 可认为可认为卡方检验的一般问题是要检验名义型变量的实卡方检验的一般问题是要检验名义型变量的实际观

7、测次数和理论次数分布之间是否存在显著差异际观测次数和理论次数分布之间是否存在显著差异。 卡方检验能检验单个多项分类名义型变量各分类间的卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得到的实计数,理论次数的观测次数是根据样本数据得到的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称则是根据理论或经验得到的期望次数。这一类检验称为为拟合性检验拟合性检验。 二、检验无差假设二、检验无差假设 无差假设无差假设: 指各项分类的实计数之间没有差异,也指各项分类的实计数之间没有差

8、异,也就是说各项分类之间的概率相等(均匀分布),就是说各项分类之间的概率相等(均匀分布),因此理论次数完全按概率相等的条件来计算。因此理论次数完全按概率相等的条件来计算。 任一项的理论次数都等于任一项的理论次数都等于总数总数/分类项数分类项数。 机动 目录 上页 下页 返回 结束 自由度也就等于分类项数减自由度也就等于分类项数减1。 例例1 随机地将麻将色子抛掷随机地将麻将色子抛掷300次,检验该色子的次,检验该色子的六个面是否均匀。结果六个面是否均匀。结果1-6点向上的次数依次是,点向上的次数依次是,43,49,56,45,66,41。 解解:每个类的理论次数是:每个类的理论次数是 300/

9、6 = 50,代入公式:,代入公式: 机动 目录 上页 下页 返回 结束 eefff202)(50)5056(50)5049(50)5043(22250)5041(50)5066(50)5045(2221 .11)5(96. 8205. 0因此,在因此,在0.05的显著性水平下,可以说这个色子的六的显著性水平下,可以说这个色子的六面是均匀的。面是均匀的。 例例2 随机抽取随机抽取60名高一学生,问他们文理要不要名高一学生,问他们文理要不要分科,回答赞成的分科,回答赞成的39人,反对的人,反对的21人,问对分科人,问对分科的意见是否有显著的差异。的意见是否有显著的差异。 解解:如果没有显著的差异

10、,则赞成与反对的各占:如果没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于是理论次一半,因此是一个无差假设的检验,于是理论次数为数为60/2=30,代入公式:,代入公式: 机动 目录 上页 下页 返回 结束 eefff202)(30)5021(30)3039(2284. 3) 1 (4 . 5205. 0所以对于文理分科,学生们的态度是有显著的差异的。所以对于文理分科,学生们的态度是有显著的差异的。 例例 某商场统计了一周中七天的顾客平均数如下表某商场统计了一周中七天的顾客平均数如下表所示,请问该商场一周各天的顾客数是否有显著所示,请问该商场一周各天的顾客数是否有显著性差异

11、?性差异?机动 目录 上页 下页 返回 结束 星期日星期日星期一星期一星期二星期二星期三星期三星期四星期四星期五星期五星期六星期六顾客数顾客数15000105001180012200132001400018500三、检验假设分布的概率三、检验假设分布的概率 这里的假设分布可以是经验性的,也可以是某理这里的假设分布可以是经验性的,也可以是某理论分布。公式中所需的理论次数则按照这里假设论分布。公式中所需的理论次数则按照这里假设的分布进行计算。的分布进行计算。 机动 目录 上页 下页 返回 结束 例例3国际色觉障碍讨论会宣布,每国际色觉障碍讨论会宣布,每12个男子中,有个男子中,有一个是先天性色盲。

12、从某校抽取的一个是先天性色盲。从某校抽取的132名男生中有名男生中有4人是色盲,问该校男子色盲比率与上述比例是否人是色盲,问该校男子色盲比率与上述比例是否有显著差异?有显著差异? 解解:按国际色觉障碍讨论会的统计结果,:按国际色觉障碍讨论会的统计结果,132人应人应该有该有132/12=11人是色盲,剩下的人是色盲,剩下的121人非色盲,人非色盲,代入公式有:代入公式有: 机动 目录 上页 下页 返回 结束 eefff202)(121)121128(11)114(2284. 3) 1 (86. 4205. 0因此,在因此,在0.05和显著性水平下,该校男子色盲比率与国际色和显著性水平下,该校男

13、子色盲比率与国际色觉障碍讨论会的统计结果有显著差异,显然根据比例可知该觉障碍讨论会的统计结果有显著差异,显然根据比例可知该校的色盲率小于国际色觉障碍讨论会的统计结果。校的色盲率小于国际色觉障碍讨论会的统计结果。 例例 教务处要求各院系在本科生毕业设计的成绩评定教务处要求各院系在本科生毕业设计的成绩评定中,注意成绩等级的人数分布,一般应符合如下表中,注意成绩等级的人数分布,一般应符合如下表格中第一行所示的比例格中第一行所示的比例 。某院。某院65名本科生毕业设计名本科生毕业设计成绩等级分布如下表第二行数字。请问该院系学生成绩等级分布如下表第二行数字。请问该院系学生毕业设计的成绩评定是否符合学校要

14、求?毕业设计的成绩评定是否符合学校要求?机动 目录 上页 下页 返回 结束 评定等级评定等级优秀优秀良好良好中等中等及格或未及格及格或未及格要求比例要求比例10%50%30%10%某院各等级人数某院各等级人数843131例例4 在英语四级考试中,某学生做对了在英语四级考试中,某学生做对了80个四择个四择一选择题中的一选择题中的28题,现在要判断该生是否是完全题,现在要判断该生是否是完全凭猜测做题。凭猜测做题。 解解:假如该生完全凭猜测做题,那么平均而言每:假如该生完全凭猜测做题,那么平均而言每道题做对的可能性是道题做对的可能性是1/4,因此,因此80个题中平均而能个题中平均而能做对做对80/4

15、=20题,代入公式有:题,代入公式有: 机动 目录 上页 下页 返回 结束 eefff202)(60)6052(20)2028(2284. 3) 1 (27. 4205. 0因此,该生可能会做一些题。因此,该生可能会做一些题。 。 例例5.某电话交换台,在某电话交换台,在100分钟内记录了每分钟被呼分钟内记录了每分钟被呼唤的次数唤的次数X,设,设f i为出现该为出现该 X值的频数,结果如下:值的频数,结果如下:X0 1 2 3 4 5 6 7 8 9f i 0 7 12 18 17 20 13 6 3 4 问总体问总体X(电话交换台每分钟呼唤次数)服从泊松(电话交换台每分钟呼唤次数)服从泊松分

16、布吗?分布吗?)05. 0( 解:解:)(:0XH按题意,原假设按题意,原假设 由于由于未知,首先须用极大似然估计法,求得未知,首先须用极大似然估计法,求得的估计值:的估计值: niixn11 iiiinPnPf22)()1(22 rkW检验统计量:检验统计量:拒绝域:拒绝域:列表计算:列表计算:33.4 xXf iP inP if i - nP iiiinPnPf2)( 12345678n=10071218172013671.3099-0.02-0.340.18 -2.293.300.95 -1.46-0.320.00006 0.0094 0.0018 0.27190.65210.0749

17、0.2857 0.0140 7.0212.3417.82 19.2916.7012.05 7.467.320.07020.12340.1782 0.19290.16700.1205 0.07460.0732,18 rK)6()1(205. 02rk ,05. 0 592.12 592.122 W3099. 12 W 2因为因为592.12 所以接受所以接受H0,认为电话交换台每分钟呼唤次数认为电话交换台每分钟呼唤次数X 服从泊松分布服从泊松分布.说明说明:将将n=0和和n=1合并,合并,n=8与与n9合并是为了合并是为了保证理论频数保证理论频数npi 4.四、连续变量分布的拟合性检验四、连续变

18、量分布的拟合性检验 首先要将测量数据整理成次数分布表和画出次分首先要将测量数据整理成次数分布表和画出次分布图,并据此选择恰当的理论分布。布图,并据此选择恰当的理论分布。 机动 目录 上页 下页 返回 结束 然后根据选择的理论分布计算出理论次数,就可然后根据选择的理论分布计算出理论次数,就可以计算卡方统计量并进行显著性检验了以计算卡方统计量并进行显著性检验了 例例5.为了研究患某种疾病的为了研究患某种疾病的2159岁男子的血压岁男子的血压(收缩压,单位:(收缩压,单位:mm-Hg )这一总体)这一总体X,抽查了,抽查了100个男子,得个男子,得 , ,样本值,样本值分组如下:分组如下:37.12

19、6 x2275.17 b序序号号分组分组fi序序号号分组分组fi12345(,99.5)99.5,109.5)109.5,119.5)119.5,129.5)129.5,139.5)582227176789139.5,149.5)149.5,159.5)159.5,169.5)169.5,)9552取取=0.10,检验,检验2159岁男子的血压(收缩压)总岁男子的血压(收缩压)总体体X是否服从正态分布。是否服从正态分布。解:解:),(20:NXH按题意,原假设按题意,原假设 由于由于,2未知,首先须用极大似然估计法,求得未知,首先须用极大似然估计法,求得其估计值(看教科书七章二节例其估计值(看

20、教科书七章二节例2):):,37.126 x2100122275.17)(1001 iiXXb iiiinPnPf22)()1(22 rkW检验统计量:检验统计量:拒绝域:拒绝域:列表计算:列表计算: 5 .99XP),(275.1737.126 NXH0为真时,为真时,)(51. 1 )( 51. 11 0655. 09345. 01 5 .1095 .99XP)()(51. 195. 0 1056. 08289. 09345. 0 )()(95. 051. 1 5 .1195 .109XP)()(95. 039. 0 )()(39. 095. 0 1772. 06517. 08289. 0

21、 5 .1295 .119XP)()(39. 018. 0 2231. 016517. 05714. 0 5 .1395 .129XP)()(18. 074. 0 1989. 05714. 07703. 0 5 .1495 .139XP)()(74. 030. 1 1329. 07703. 09032. 0 139. 018. 0 )()( 5 .1595 .149XP)()(30. 187. 1 0661. 09032. 09693. 0 5 .159XP)( 87. 11 0307. 09693. 01 列表计算:列表计算:12345678n=10058222717957XfiPinPif

22、i - nPiiiinPnPf2)( 分组分组(,99.5)99.5,109.5)109.5,119.5)119.5,129.5)129.5,139.5)139.5,149.5)149.5,159.5)159.5, )0.06550.10560.17720.22310.19890.13290.06610.03076.5510.5617.7222.3119.8913.296.613.07-1.55-2.564.284.69-2.89-4.292.320.36680.62061.03380.98590.41991.38480.55605.3678,27 rK)4()1(210. 02rk ,10.

23、 0 779. 7 779. 72 W3678. 52 W 2因为因为779. 7 所以接受所以接受H0,即即2159岁男子的血压(收缩压)总体岁男子的血压(收缩压)总体X服从正态分布。服从正态分布。 第三章 第二节第二节机动 目录 上页 下页 返回 结束 独立性检验机动 目录 上页 下页 返回 结束 总体分布的卡方检验实际上是单变量引起的次数分布总体分布的卡方检验实际上是单变量引起的次数分布的差异性检验。如果是两个变量,甚至三个变量交叉的差异性检验。如果是两个变量,甚至三个变量交叉引起的次数分布,该如何检验呢?可以使用交叉列联引起的次数分布,该如何检验呢?可以使用交叉列联表中的卡方检验和相关

24、分析。表中的卡方检验和相关分析。机动 目录 上页 下页 返回 结束 品质数据品质数据(概念要点)(概念要点)1.品质随机变量的结果表现为类别品质随机变量的结果表现为类别. 例如:性别例如:性别(男男, 女女)2.各类别用符号或数字代码来测度各类别用符号或数字代码来测度一、列联表一、列联表3.使用定类或定序尺度使用定类或定序尺度你吸烟吗你吸烟吗? 1.是;是;2.否否你赞成还是反对这一改革方案你赞成还是反对这一改革方案? 1.赞成;赞成;2.反对反对4.对品质数据的描述和分析通常使用列联表对品质数据的描述和分析通常使用列联表5.可使用可使用2检验检验机动 目录 上页 下页 返回 结束 列联表列联

25、表(概念要点)(概念要点)1.由两个以上的变量进行交叉分类的频数分布表由两个以上的变量进行交叉分类的频数分布表2.行变量的类别用行变量的类别用r 表示,表示, ri 表示第表示第i个类别个类别3.列变量的类别用列变量的类别用c 表示,表示, cj 表示第表示第j个类别个类别4.每种组合的观察频数用每种组合的观察频数用fij 表示表示5.表中列出了行变量和列变量的所有可能的组合,所表中列出了行变量和列变量的所有可能的组合,所以称为列联表以称为列联表机动 目录 上页 下页 返回 结束 列联表的结构列联表的结构( r c 列联表的一般表示)列联表的一般表示)例例1 一个集团公司在四个不同的地区设有分

26、公司,一个集团公司在四个不同的地区设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及现该集团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方式,从四个到各分公司的利益,故采用抽样调查方式,从四个分公司共抽取分公司共抽取420个样本单位个样本单位(人人),了解职工对此项,了解职工对此项改革的看法,调查结果如下表改革的看法,调查结果如下表机动 目录 上页 下页 返回 结束 一分公司一分公司一分公司一分公司一分公司一分公司一分公司一分公司合计合计赞成该方案赞成该方案68755779279反对该方案反对该方案32453331141合计合计10012090110420机动 目

27、录 上页 下页 返回 结束 列联表的分布列联表的分布(概念要点)(概念要点)观察值的分布观察值的分布1.边缘分布边缘分布 行边缘分布行边缘分布: 行观察值的合计数的分布行观察值的合计数的分布例如,赞成改革方案的共有例如,赞成改革方案的共有279人,反对改革方案的人,反对改革方案的141人人 列边缘分布列边缘分布: 列观察值的合计数的分布列观察值的合计数的分布例如,四个分公司接受调查的人数分别为例如,四个分公司接受调查的人数分别为100人,人,120人,人,90人,人,110人人2.条件分布与条件频数条件分布与条件频数变量变量X 条件下变量条件下变量Y 的分布,或在变量的分布,或在变量Y 条件下

28、变条件下变量量X 的分布的分布每个具体的观察值称为条件频数每个具体的观察值称为条件频数机动 目录 上页 下页 返回 结束 观察值的分布观察值的分布机动 目录 上页 下页 返回 结束 百分比分布百分比分布(概念要点)(概念要点)1.条件频数反映了数据的分布,但不适合进行对比条件频数反映了数据的分布,但不适合进行对比2.为在相同的基数上进行比较,可以计算相应的百分为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布比,称为百分比分布.行百分比:行的每一个观察频数除以相应的行合计数行百分比:行的每一个观察频数除以相应的行合计数(fij / ri)列百分比:列的每一个观察频数除以相应的列合计

29、数列百分比:列的每一个观察频数除以相应的列合计数( fij / cj )总百分比:每一个观察值除以观察值的总个数(总百分比:每一个观察值除以观察值的总个数( fij / n )机动 目录 上页 下页 返回 结束 百分比分布百分比分布机动 目录 上页 下页 返回 结束 期望频数的分布期望频数的分布(概念要点)(概念要点)1.假定行变量和列变量是独立的假定行变量和列变量是独立的2.一个实际频数一个实际频数fij 的期望频数的期望频数eij ,是总频数的个数,是总频数的个数n 乘以该实际频数乘以该实际频数fij 落入第落入第i 行和第行和第j列的概率,即列的概率,即ncrncnrnejijiij机动

30、 目录 上页 下页 返回 结束 例例1(续续)第1行和第1列的实际频数为f11 ,它落在第1行的概率估计值为该行的频数之和r1除以总频数的个数n ,即:r1/n;ncnr11它落在第1列的概率的估计值为该列的频数之和c1除以总频数的个数n ,即:c1/n 。根据概率的乘法公式,该频数落在第1行和第1列的概率应为由于观察频数的总数为n ,所以f11 的期望频数e11 应为6643.66420100279111111ncrncnrne机动 目录 上页 下页 返回 结束 根据上述公式计算的前例的期望频数根据上述公式计算的前例的期望频数机动 目录 上页 下页 返回 结束 卡方检验还可以用于检验两个或两

31、个以上因素(各有卡方检验还可以用于检验两个或两个以上因素(各有两项或以上的分类)之间是否相互影响的问题,这种两项或以上的分类)之间是否相互影响的问题,这种检验称为独立性检验。检验称为独立性检验。 所谓独立,即无关联,互不影响,就意味着一个因素所谓独立,即无关联,互不影响,就意味着一个因素各个分类之间的比例关系,在另一个因素的各项分类各个分类之间的比例关系,在另一个因素的各项分类下都是相同的,下都是相同的, 卡方独立性检验的零假设是各因素之间相互独立。卡方独立性检验的零假设是各因素之间相互独立。 二、独立性检验二、独立性检验机动 目录 上页 下页 返回 结束 其原理是根据这一概率定理:若两变量无

32、关,则两变其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率量中联合事件发生的概率应等于各自独立发生的概率乘积。乘积。jiijPPP在列联表中,这一定理就具体转化为:若两变量无在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,或,两变量不独立。积。反之,则两变量有关,或,两变量不独立。机动 目录 上页 下页 返回 结束 2统计量统计量(概念要点)(概念要点)1. 用于检验列联表中变量之间是否存在显著性差异,用于检验列联表中变量之间是否存在显著性差异

33、,或者用于检验变量之间是否独立或者用于检验变量之间是否独立2. 基本基本计算公式为计算公式为其自由度为其自由度为: (r-1)(c-1)ricjijijijeef1122)(专用专用计算公式为计算公式为122crijnnfn适用条件:表中不宜有适用条件:表中不宜有1/5以上格子的理论频数小于以上格子的理论频数小于5,或有一个格子的理论频数小于,或有一个格子的理论频数小于1。机动 目录 上页 下页 返回 结束 例例1(续续)0319. 3)(1122ricjijijijeef机动 目录 上页 下页 返回 结束 一致性检验一致性检验(概念要点)(概念要点)1.检验列联表中目标变量之间是否存在显著性

34、差异检验列联表中目标变量之间是否存在显著性差异2.检验的步骤为检验的步骤为ricjijijijeef1122)(提出假设提出假设 H0:P1 = P2 = = Pj (目标变量的各个比例一致目标变量的各个比例一致) H1:P1 , P2 , , Pj 不全相等不全相等(各个比例不一致各个比例不一致)计算检验的统计量计算检验的统计量进行决策进行决策根据显著性水平根据显著性水平和自由度和自由度(r-1)(c-1)查出临界值查出临界值2若若 ,拒绝,拒绝H0;若;若 ,接受,接受H02222机动 目录 上页 下页 返回 结束 例例1(续续)0319. 3)(1122ricjijijijeef检验职工

35、的态度是否与所在单位有关?检验职工的态度是否与所在单位有关?) 1 . 0(提出假设提出假设 H0:P1 = P2 = P3 = P4 (赞成比例一致赞成比例一致) H1:P1 , P2 , P3 , P4 不全相等不全相等(赞成比例赞成比例不一致不一致)计算检验的统计量计算检验的统计量根据显著性水平根据显著性水平0.1和自由度和自由度(2-1)(4-1)=3查出相查出相应的临界值应的临界值 。25. 62由于 ,接受H0251. 60319. 322例例2某校对学生课外活动内容进行调查,结果整理某校对学生课外活动内容进行调查,结果整理成下表。成下表。 机动 目录 上页 下页 返回 结束 性别

36、(因素2)课外活动内容(因素1)小计和体育文娱阅读男生21112355女生 6 72942小计和27185297男女生在选择课外活动上是否存在显著的差异男女生在选择课外活动上是否存在显著的差异?机动 目录 上页 下页 返回 结束 解解:由于所有学生参加三项活动的比例是由于所有学生参加三项活动的比例是27:18:52,因,因此如果课外活动的选择与性别没有关系的话,男女生此如果课外活动的选择与性别没有关系的话,男女生参加这三项活动的比例也应是这同一比例,而男女各参加这三项活动的比例也应是这同一比例,而男女各自的人数可以计算,所以每格内的理论次数的计算方自的人数可以计算,所以每格内的理论次数的计算方

37、法如下:法如下: 男生中男生中参加体育活动的理论人数:5527/97=15.3 女生中女生中 参加体育活动的理论人数:4227/97=11.7 机动 目录 上页 下页 返回 结束 性别(因素2)课外活动内容(因素1)小计和(fx)体育文娱阅读男生21(15.3)11(10.2)23(29.5)55女生 6(11.7) 7(7.8)29(22.5)42小计和(fy)2718529725 .29)5 .2923(2 .10)2 .1011(3 .15)3 .1521(2225 .22)5 .2229(8 . 7)8 . 77(7 .11)7 .116(222=8.3552或或:2152422918

38、4872742652552318551127552197222222=8.3552机动 目录 上页 下页 返回 结束 20.05(2) = 5.99 所以在0.05的显著性水平下,拒绝零假设,即可以认为性别与课外活动内容有关联,或者说男女生在选择课外活动上存在显著的差异。 例例某研究人员收集了亚洲、欧洲和北美洲人的某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表所示,其目的是研究不血型资料,结果见表所示,其目的是研究不同地区的人群血型分类构成比是否一样同地区的人群血型分类构成比是否一样机动 目录 上页 下页 返回 结束 地区ABABO合计亚洲32136995295108

39、0欧洲2584322194517北美洲 40810637444995合计9875181549332595查查2界值表界值表v=(3-1)(4-1)=6, 拒绝拒绝H0,认为三个地区的人群血型分布构成不同或不,认为三个地区的人群血型分布构成不同或不全相同。全相同。20.05(6)12.59220.05(6)建立假设建立假设 H0:不同地区的人群血型分布构成相同:不同地区的人群血型分布构成相同 H1:不同地区的人群血型分布构成不同或不全相同:不同地区的人群血型分布构成不同或不全相同=0.05计算检验统计:计算检验统计:e11=1080987/2592=411.5 e12=215.83 e13=64

40、.17 e14=388.75 e21=196.87 e22=103.32 e23=30.72 e24=186.10 e31=378.88 e32=198.8 e33=59.12 e34=358.15215.358)15.358444(25.41)25.41321(22=297.59例例 某医生想观察一种新药对流感的预防效果,进行某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?了如下的研究,问此药是否有效? 机动 目录 上页 下页 返回 结束 发病人数发病人数未发病人数未发病人数观察例数观察例数发病率发病率%实验组实验组148610014对照组对照组309012025合计

41、合计4417622020机动 目录 上页 下页 返回 结束 独立独立性检验性检验(概念要点)(概念要点)1.检验列联表中的行变量与列变量之间是否独立检验列联表中的行变量与列变量之间是否独立2.检验的步骤为检验的步骤为ricjijijijeef1122)(提出假设提出假设 H0:行变量与列变量独立:行变量与列变量独立 H1:行变量与列变量不独立:行变量与列变量不独立计算检验的统计量计算检验的统计量进行决策进行决策根据显著性水平根据显著性水平和自由度和自由度(r-1)(c-1)查出临界值查出临界值2若若 ,拒绝,拒绝H0;若;若 ,接受,接受H02222例例3一种原料来自三个不同的地区,原料质量被

42、分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。检验各地区与原料之间是否存在依赖关系( =0.05)机动 目录 上页 下页 返回 结束 机动 目录 上页 下页 返回 结束 解解:提出假设提出假设 H0:地区与原料等级之间独立:地区与原料等级之间独立 H1:地区与原料等级之间不独立:地区与原料等级之间不独立计算检验的统计量计算检验的统计量82.19)(1122ricjijijijeef根据显著性水平根据显著性水平0.05和自由度和自由度(3-1)(3-1)查出临界值查出临界值488. 9205. 0由于由于 , 拒绝拒绝H0488. 982.192例例 观察依沙酰胺治疗皮肤真菌感染效果的临床试验,见表, 试分析该病的疗效是否与病程有关?机动 目录 上页 下页 返回 结束 机动 目录 上页 下页 返回 结束 解解:建立假设,确定检验水准建立假设,确定检验水准:H0:依沙酰胺治疗皮肤真菌感染疗效与病程无关H1:依沙酰胺治疗皮肤真菌感染疗效与病程有关检验水准=0.05。计算检验统计量计算检验统计量机动 目录 上页 下页 返回 结束 )6(639.24205. 02拒绝H0,接受H1,差异有统计学意义。可以认为依沙酰胺治疗皮肤真菌感染疗效与病程有关。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文([管理学]第3章定性数据的卡方检验课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|