1、 某医疗机构为了了解呼吸道疾病与吸某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调烟是否有关,进行了一次抽样调查,共调查了查了515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不人,不吸烟者吸烟者295295人,调查结果是:吸烟的人,调查结果是:吸烟的220220人人中中3737人患人患病病,183 183人不患人不患病病;不吸烟的;不吸烟的295295人中人中2121人患人患病病,274274人不患人不患病病。根据这些数据能否断定:患肺癌与根据这些数据能否断定:患肺癌与吸烟有关吗?吸烟有关吗?患病患病不患病不患病总计总计吸烟吸烟3737183183220
2、220不吸烟不吸烟2121274274295295总计总计5858457457515515为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:列列2 22 2联联表表在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 7.12%7.12%16.82%16.82%上述结论能什么吸烟与患病有关吗?能有多大把上述结论能什么吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?握认为吸烟与患病有关呢?患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+
3、da+b+c+da+b+c+d列出列出2 22 2列联表列联表 假设假设H H0 0:吸烟和患病吸烟和患病之间没有关系之间没有关系 即即H H0 0:P(AB)P(AB)P(A)P(B)P(A)P(B)其中其中A A为某人吸烟,为某人吸烟,B B为某人患病为某人患病 设设n na ab bc cd d 则则P(A)P(A)nba P(B)P(B)nca 故故P(AB)P(AB)ncanba吸烟且患病人数吸烟且患病人数ncanbanABPn)(吸烟但未患病人数吸烟但未患病人数ndbnbanBAPn)(不吸烟但患病人数不吸烟但患病人数ncandcnBAPn)(不吸烟且未患病人数不吸烟且未患病人数n
4、dbndcnBAPn)(怎样描述实际观测值与估计值的差异呢?怎样描述实际观测值与估计值的差异呢?统计学中采用统计学中采用ncanbanncanbana22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)()()()()(22dcbadbcabcadn 化简得化简得2(2 2观观测测值值预预期期值值)用用卡卡方方统统计计量量:预预期期值值来来刻刻画画实实际际观观测测值值与与估估计计值值的的差差异异.即即 独立性检验第一步:第一步:H H0 0:吸烟吸烟和和患病患病之间没有关系之间没有关系 通过数据和图表分析,得到通过数据和图表分析,得
5、到结论是:结论是:吸烟与患病有关吸烟与患病有关结论的可靠结论的可靠程度如何?程度如何?患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二步:列出2 22 2列联表列联表 用用2 2统计量研究统计量研究这类问题的方法这类问题的方法步骤步骤第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。dcban其中 22na db cabcdacbdP(x0)0.500.400.250.150.100.0
6、50.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828828.102 635.62 706.22 706.22 0.1%0.1%把握认把握认为为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认为为A
7、 A与与B B有关有关99%99%把握认把握认为为A A与与B B有关有关90%90%把握认把握认为为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,有关,但也不能显示但也不能显示A A与与B B无关无关例如例如 独立性检验通过公式计算通过公式计算患病患病不患病不患病总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965632.5691987421487817209942497775996522 H H0 0
8、:吸烟吸烟和和患病患病之间没有关系之间没有关系解解:已知在已知在 成立的情况下,成立的情况下,0H故有故有99.9%99.9%的把握认为的把握认为H H0 0不成立,即有不成立,即有99.9%99.9%的把握认为的把握认为“患病与吸烟有关系患病与吸烟有关系”。即在即在 成立的情况下,成立的情况下,大于大于10.82810.828概率非常概率非常小,近似为小,近似为0.0010.0010H2现在的现在的 =56.632 =56.632的观测值远大于的观测值远大于10.82810.828,出现这样的观测值的概率不超过出现这样的观测值的概率不超过0.0010.001。2001.0)828.10(2
9、P反证法原理与假设检验原理反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。例例1.1.在在500500人身上试验某种血清预防感冒作用,把他们人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外一年中的感冒记录与另外500500名未用血清的人的感冒记名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?感冒的作用?未感冒未感冒感冒感冒合计合计使用血清使用血清258242500未使用血清未使用血清21
10、6284500合计合计4745261000解:设解:设H0:感冒与是否使用该血清没有关系。:感冒与是否使用该血清没有关系。075.7500500526474216242284258100022 因当因当H0成立时,成立时,26.635的概率约为的概率约为0.01,故有,故有99%的把握认的把握认为该血清能起到预防感冒的作用。为该血清能起到预防感冒的作用。P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(x0)0.5
11、00.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828有效有效无效无效合计合计口服口服585840409898注射注射646431319595合计合计1221227171193193解:设解:设H0:药的效果与给药方式没有关系。:药的效果与给药方式没有关系。3896.19598711224064315819322 因当因当H0成立时,成立时,21.3896的概率大于的概率大于15%,故不能否定假设,故不能否定假设H0,即不能作出药的效果与
12、给药方式有关的结论。,即不能作出药的效果与给药方式有关的结论。2.072例例2 2:为研究不同的给药方式(口服与注射)和药的效:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的调查的结果列在表中,根据所选择的193193个病人的数个病人的数据,能否作出药的效果和给药方式有关的结论?据,能否作出药的效果和给药方式有关的结论?P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072
13、 2.706 3.841 5.024 6.635 7.879 10.828例例3:气管炎是一种常见的呼吸道疾病,医药研究人:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?所得数据如表所示,问:它们的疗效有无差异?有效有效无效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345解:设解:设H0:两种中草药的治疗效果没有差异。:两种中草药的治疗效果没有差异。098.11100245702759161918434522 因当因当H0成立时,成立时,210.828的概率为的概率为0.001,故有,故有99.9%的把握认的把握认为,两种药物的疗效有差异。为,两种药物的疗效有差异。