1、卫生统计学课程复习资料一、名词解释1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量。4.总体:总体指特定研究对象中所有观察单位的测量值。5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sam
2、ple)。6.变异:同质个体间研究因素的差异。7.频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。8.算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用表示。9.中位数:将一组观察值由小到大排列,位次居中的那个数。10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度
3、的比较。14.正态分布:若资料的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号表示均数为,标准差为的正态分布。15.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为。16统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。18.标准误:通常将样本统计量的标准差称为标准误。19.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。20.参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。21.假设检
4、验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。22.I型和II型错误:I型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用表示;II型错误,指接受了实际上不成立的H0,这类“存伪”的错误称为II型错误,其概率大小用表示。23.检验效能:1-称为检验效能,它是指当两总体确有差别,按规定的检验水准所能发现该差异的能力。24.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准,记为。25.方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自
5、由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。26.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。27.相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。28.标准化法:是常用于内部构成不同的两个或多个总率比较的一种方法。标准化
6、法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。29.构成比(proportion):表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为 30.Yates校正:英国统计学家Yates F认为,由于分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的值不连续,尤其是自由度为1的四格表,求出的概率P值可能偏小,此时需对值作连续性校正(correction of continuity),
7、这一校正即所谓的Yates校正(Yates correction)。31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。32.直线回归:建立一个描述应变量依自变量变化
8、而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。33.相关系数:又称积差相关系数,以符号r表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。35.回归系数:是直线的斜率(slope),其统计意义是当变化一个单位时的平均改变的估计值。时直线从左下方走向右上方,随的增大而增大;时直线从左上方走向右下方,随的增大而减小;时直线与轴平行,与无直线关系。的计
9、算公式为二、单项选择题1.观察单位为研究中的( D )。A.样本 B.全部对象 C.影响因素 D.个体2.总体是由( C )。A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 3.抽样的目的是( B )。A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体统计量4.参数是指( B )。A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和5.关于随机抽样,下列那一项说法是正确的( A )。A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D
10、.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( B )。A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( A )。A.变异系数 B.方差 C.极差 D.标准差8.以下指标中( )可用来描述计量资料的离散程度。( D )A.算术均数 B.几何均数 C.中位数 D.标准差9.血清学滴度资料最常用来表示其平均水平的指标是( C )。A.算术平均数 B.中位数 C.几何均数 D.平均数10.两样本均数的比较,可用( C )。A.方差分析 B.t 检验 C.两者均可 D.方差齐性检验11.配伍
11、组设计的方差分析中,配伍等于( D )。A.总-误差 B.总-处理 C.总-处理+误差 D.总-处理-误差12.在均数为,标准差为的正态总体中随机抽样,( )的概率为5%。( B )A. B. C. D.13.完全随机设计方差分析的检验假设是( D )。A.各处理组样本均数相等 B.各处理组总体均数相等C.各处理组样本均数不相等 D.各处理组总体均数不全相等14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。A.分别进行比较 B.两个率比较的2检验 C.不具备可比性,不能比较 D.对性别进行标准化后再比较15.率
12、的标准误的计算公式是( D )。A. B. C. D.16.非参数统计应用条件是( C )。A.总体是正态分布 B.若两组比较,要求两组的总体方差相等C.不依赖于总体分布 D.要求样本例数很大17.下述哪些不是非参数统计的特点( D )。A.不受总体分布的限定 B.多数非参数统计方法简单,易于掌握C.适用于等级资料 D.检验效能总是低于参数检验18.设配对设计资料的变量值为X1和X2,则配对资料的秩和检验( A )。A.把X1与X2的差数绝对值从小到大编秩 B.把X1和X2综合从小到大编秩C.把X1和X2综合按绝对值从小到大编秩 D.把X1与X2的差数从小到大编秩19.秩和检验和t检验相比,其
13、优点是( A )。A.计算简便,不受分布限制 B.公式更为合理 C.检验效能高 D.抽样误差小20.对两样本均数作比较时,已知n1、n2均小于30,总体方差不齐且分布呈偏态,宜用( C )。A.t 检验 B.u 检验 C.秩和检验 D.F检验21.等级资料的比较宜用( B )。A.t 检验 B.秩和检验 C.F检验 D.四格表X2检验22.两个小样本比较的假设检验,应首先考虑( D )。A.t 检验 B.秩和检验 C.任选一种检验方法 D.资料符合哪种检验的条件23.对于配对比较的秩和检验,其检验假设为( B )。A.样本的差数应来自均数为0的正态总体 B.样本的差数应来自均数为0的非正态总体
14、C.样本的差数来自中位数为0的总体 D.样本的差数来自方差齐性和正态分布的总体24.用最小二乘法确定直线回归方程的原则是各观察点( B )。A.距直线的纵向距离相等 B.距直线的纵向距离的平方和最小C.与直线的垂直距离相等 D.与直线的垂直距离的平方和最小25.实验设计的三个基本要素是( D )。A.受试对象、实验效应、观察指标 B.随机化、重复、设置对照C.齐同对比、均衡性、随机化 D.处理因素、受试对象、实验效应26.实验设计的基本原则( D )。A.随机化、盲法、设置对照 B.重复、随机化、配对 C.随机化、盲法、配对 D.随机化、重复、设置对照27.实验设计和调查设计的根本区别是( D
15、 )。A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组 D.实验设计可人为设置处理因素28.标准正态分布的均数与标准差分别为( A )。A.0与1 B.1与0 C.0与0 D.1与129.正态分布有两个参数与,( )相应的正态曲线的形状越扁平。( C )A. 越大 B. 越小 C. 越大 D.越小30.若X服从以,为均数和标准差的正态分布,则X的第95百分位数等于( B )。A. B. C. D.31.计算某地某年麻疹发病率,其分母为 ( E )A.该地体检人数 B.该地年平均就诊人数C.该地年平均人口数 D.该地平均患者人数 E.该地易感人群人数 32.两个独立小样本计
16、量资料比较的假设检验,首先应考虑( E )A.用 检验 B.用检验 C.用Wilcoxon秩和检验D.检验或Wilcoxon秩和检验均可 E.资料符合检验还是Wilcoxon秩和检验条件33.若决定系数为0.04,则下列说法错误的是( A ) A.散点图中所有的实测点都排列在一条回归线上 B.决定系数即是 C.y的总变异中有4可以由x的变化来解释 D.相关系数0.2 E.回归贡献相对较小 34.老年人口系数下降,可使 ( B )A.粗死亡率上升 B.粗死亡率下降 C.婴儿死亡率上升 D.婴儿死亡率下降 E.以上都不对 35.标准化以后的总死亡率( D )A.标化后的率比原来的率低 B.标化后的
17、率比原来的率高C.反映了实际水平 D.反映了相对水平,仅作为比较的基础 E.不随标准选择的变化而变化36.配对样本差值的Wilcoxon符号秩检验,确定值的方法为( D )A.越大,越大 B.越大,越小C.值在界值范围内,小于相应的 D.值在界值范围内,大于相应的E.值即值,查界值表37.关于回归系数的描述,下列说法错误的是( A )A.,表示回归直线与y轴交点在原点上方 B.,回归直线与x轴平行 C.越大,则回归直线越陡 D.b一般有单位 E.表示回归直线从左上方走向右下方38.实验设计和调查设计的根本区别是( D )A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组 D
18、.实验设计可人为设置处理因素 E.两者无区别39.少年儿童人口系数下降,可使( A )A.粗死亡率上升 B.粗死亡率下降 C.出生率上升 D.出生率下降 E.生育率下降40.以下对于标准化法的描述错误的是 ( C )A.标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性B.样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需做假设检验C.标准化率代表真实的死亡(或患病、发病)率水平D.一般在已知被标化组各年龄组死亡率时,宜采用直接法计算标准化率E.当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不
19、宜采用标准化法41.多样本计量资料的比较,当分布类型不清时选择( D )A.检验 B.检验 C.检验 D.检验 E.检验42.回归系数的假设检验,其无效假设是( E )A. B. C. D. E.43.估计样本含量时,所定第类误差愈小,则( A )A.所要的样本含量愈大 B.所要的样本含量愈小C.不影响样本含量 D.所定的样本含量愈准确 E.所定的样本含量愈粗糙44.欲计算某年新生儿死亡率,则应选用作为分母的是( B )A.某年新生儿总数 B.某年活产总数 C.当年怀孕的妇女数 D.妊娠28周以上的妇女数E.妊娠28周以上出生并存活的新生儿45.用以说明某现象发生的频率或强度的指标为 ( A
20、)A.率 B.构成比 C.相对比 D.绝对数 E.均数46.当四个样本率比较,得到0.05,3,则可以认为 ( D )A.四个样本率都不相同 B.四个总体率都不相同C.四个样本率不同或不全相同 D.四个总体率不同或不全相同 E.以上都不对47.成组设计两样本比较的秩和检验,其检验统计量是( C )A.以秩和较小者为 B.以秩和较大者为C.以例数较小者秩和为 D.以例数较大者秩和为 E.当两样本例数不等时,可任取一样本的秩48.直线回归分析中,有直线回归方程=0.004+0.0488X ,代入两点描出回归线。下面选项哪项正确( B )A.所有实测点都应在回归线上 B.所绘回归直线必过点(,)C.
21、原点是回归直线与Y轴的交点 D.回归直线X的取值范围为(-1,1) E.实测值与估计值差的平方和必小于零49.研究A药抗癌效果,将患有某种肿瘤的大白鼠随机分为两组,一组未给药,一组饲服抗癌A药;2周后检测体内存活的肿瘤细胞数。这种对照在实验设计中称为 ( B )A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照50.行列表中,对于理论频数太小的情形,最好采用( A )A.增大样本容量,以达到增大理论频数的目的 B.删去理论频数太小的格子所对应的行或列C.理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并 D.性质不同的行或列中的实际频数合并 E.使用连续性校正公式5
22、1.直线相关分析中,对相关系数作假设检验,其目的是 ( B )A.检验相关系数r 是否等于0 B.推断两变量间是否存在直线相关关系C.检验两总体相关系数是否相等 D.推断两变量间相关方向 E.推断两变量间密切程度52.用最小二乘法确定直线回归方程的原则是( B )A.各观测点距直线的纵向距离相等 B.各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等 D.各观测点距直线的垂直距离平方和最小E.各观测点距直线的纵向距离最小53.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效的“胃苏
23、冲剂”。这种对照在实验设计中称为 ( D )A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照54.某研究欲调查某市中学生对艾滋病的认识,从全市40所中学随机抽取4所,对该4所学校的全部学生实施问卷调查。该种抽样方法属于( A )A.整群抽样 B.分层抽样 C.系统抽样 D.简单随机抽样 E.多阶段抽样三、简答题1.对于一组近似正态分布的资料,除样本含量n外,还可计算和,问各说明什么?答:三个指标分别说明:(1)为算术均数,说明正态分布或近似正态分布资料的集中趋势;(2)为标准差,说明正态分布或近似正态分布资料的离散趋势;(3)可估计正态指标的95%的医学参考值范围,即此范
24、围在理论上应包含总体的95%的个体值。2.说明频数分布表的用途。答:频数分布表的用途是:(1)描述频数分布的类型;(2)描述频数分布的特征;(3)便于发现一些特大或特小的可疑值;(4)便于进一步做统计分析和处理。3.试述正态分布的面积分布规律。答:正态分布的面积分布规律是:(1)轴与正态曲线所夹面积恒等于或;(2)区间的面积为,区间的面积为,区间的面积为。4.均数的可信区间与参考值范围有何不同?答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。区别点均数的可信区间参考值范围意义按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算得的可信区间
25、要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当a=0.05时为95%)的可能性包含了总体均数。“正常人”的解剖、生理、生化某项指标的波动范围。计算公式s未知:*s已知:*s未知但n60: *正态分布:*偏态分布:PXP100-X用途估计总体均数判断观察对象的某项指标正常与否* 也可用(对应于单尾概率时)*也可用(对应于单尾概率时)5.假设检验中a和P的区别何在?答:a和P均为概率,其中a是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验
26、统计量值的概率。在假设检验中通常是将P与a对比来得到结论,若Pa,则拒绝H0,接受H1,有统计学意义,可以认为不同或不等;否则,若Pa,则不拒绝H0,无统计学意义,还不能认为不同或不等。6.假设检验时,当,则拒绝,理论依据是什么?答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知
27、道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。7.怎样正确选用单侧检验和双侧检验?答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。8.为什么假设检验的结论不能绝对化?答:因为通过假设检验推断作出的结论具有概率性,其结论不可
28、能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。9.为什么不能以构成比代率?请联系实际加以说明。答:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,5060岁年龄组的高血压病例占52.24%,所占比重最大,60岁组则只占到6.74%。这是因为60岁以上受检人数少,造成患病数低于5060岁组,因而构成比相对较低。但不能认为年龄在5
29、060岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。10.方差分析的基本思想和应用条件是什么?答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。方差分析的应用条件:各样本是相互独立的随机样本,均服从正态分布;相互比较的各样本的总体方差相等,即具有方差齐性。11.为什么在方差分析
30、的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法?答:方差分析的备择假设H1是g个总体均数不全相等,拒绝H0,接受H1,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。12.对于四格表资料,如何正确选用检验方法?答:(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。(2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择不同的计算公式:当且所有的时,用检验的基本公式或四格表资料检验的专用公式;当 但有时,用四格表资料检验的校正公式或,或改用四格表资
31、料的Fisher确切概率法;当,或时,用四格表资料的Fisher确切概率法。若资料满足两样本率检验的条件,也可用检验。(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时当时,;当时,。13.什么叫做非参数检验?它和参数检验有什么区别?答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。14.简述直线相关与秩相关的区别与联系。答:二者的联系:(1)两者所解决的应用问题相同,都可用来表示两个数值变量之间关系的方向和密切程度。(2)两个相关系数都没有单位
32、,取值范围都在-11之间。(3)计算上,用秩次作积差相关,得到的就是秩相关系数。二者的区别:(1)资料要求不同。积差相关要求、服从双变量正态分布,秩相关可以是任意分布。(2)由于对资料要求不同,二者分属于参数统计与非参数统计方法,所以符合双变量正态分布条件时,积差相关的效率高于秩相关。(3)二者假设检验方法不同。15.统计表有哪些要素构成?制表的注意事项有哪些?答:一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。编制统计表的注意事项:(1) 标题概括表的内容,写于表的上方,通常需注明时间与地点。(2) 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。(3) 线条不宜
33、过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线。(4) 表内一律采用阿拉伯数字。同一指标小数点位数要一致,数次要对齐。表内不留空格。(5) 备注不要列于表内,如有必要,可在表内用“ * ”号标记,并在表外加以说明。16.试述x2检验的基本思想答:检验的基本思想是以值的大小来反映理论频数T与实际频数A的吻合程度。在零假设(比如:)成立的条件下,实际频数与理论频数相差不应该很大,即值不应该很大,若实际计算出的值较大,超过了设定的检验水准所对应的界值,则有理由怀疑的真实性,从而拒绝,接受H1(比如:)。17.非参数统计的特点和适用范围.答:特点:(1)对样本所来自的总体的
34、分布形式不作要求,分布未知都能适用。(2)收集资料方便,可用“等级”或“符号”来评定观察结果。(3)多数非参数方法比较简便,易于理解和掌握。(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。适用范围:(1)等级资料。(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。(3)各组离散程度相差悬殊,即方差明显不齐,且通过变换亦不能达到齐性。(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。 (6)资料初步分析。18.两组或多组等级资料的比较,为什么不能用x2
35、检验,而用秩转换的非参数检验?答:若选行列表资料的检验,只能推断两个或多个总体的等级构成比差别,这一般不是推断目的;而选秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。19.普通线图和半对数线图的主要区别是什么?答:从形式上看,二者的不同点在于纵坐标的尺度不同,普通线图的纵坐标为算术尺度,而半对数线图的纵坐标为对数尺度。从用途上看,普通线图描述的是统计量的绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。20.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?答:参数检验和非参数检验各有
36、适用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验为佳。以t检验为例,如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。21.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机化原
37、则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。四、分析计算题1.某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对共2组,随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见下表第(1)、(2)、(3)栏。试比较两组猪脑组织钙泵的含量有无差别。 两组乳猪脑组织钙泵含量(m g/g)乳猪号(1)对照组(2)试验组(3)差值d(4)=(2)-(3)10.35500.27550.079520.20000.2545-0.054530
38、.31300.18000.133040.36300.32300.040050.35440.31130.043160.34500.29550.049570.30500.28700.0180合计0.3086解:本例属异体配对设计,所得数据为配对计量资料,用配对t检验进行处理。(1)建立检验假设,确定检验水准H0:md0H1:md0a =0.05。 (2)计算检验统计量n=7, (3)确定P值,作出推断结论按n= n-1=7-1=6查t界值表,得t0.025,6=2.447,t0.05,按a =0.05水准不拒绝H0,差别无统计学意义,即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。2.某
39、医院比较几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗54例,有效47例;中西医结合组治疗68例,有效65例。问:该资料属何种资料?实验设计属何种设计?欲比较3种疗法的疗效的差别,宜选用何种假设检验方法?写出该种检验方法的与;若求得的检验统计量为8.143,相应于的检验统计量的临界值为5.99,你如何做出结论?根据你的结论,你可能犯哪一类统计错误?解:(1)该资料属计数资料?实验设计属完全随机设计;(2)宜选用RC表的检验方法;(3):3种疗法的总体有效率相等:3种疗法的总体有效率不全相等(4)在的水准上,拒绝,接受,差别有统计学意义,可认为3种疗法的总体有效率
40、不全相等,即3种疗法对慢性胃炎病人的疗效有差别。可能犯I型错误。3.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L),血铅均数为1.81(mg/L)。服用果胶20天后再测,尿铅均数降为0.087(mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。解:人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,
41、面积减少百分率为40%以上者为治疗有效。问:(1) 如何将病人分组?(2) 如何对结果进行统计分析处理?解:(1) 根据题意,该设计为配对设计,首先将20例病人按年龄、性别、病型和病情等条件进行配对后,将10对患者从1到10编号,再任意指定随机排列表中的任一行,比如第8行,舍去1020,将随机数排列如下,规定逢单数者每对中的第1号试验对象进入胃舒氨组(A),第2号对象进入西米替丁组(B),逢双数者则相反。分组情况如下所示:病 人 号1.12.13.14.15.16.17.18.19.110.11.22.23.24.25.26.27.28.29.210.2随机数字3261809547入组情况AB
42、BABBAABABAABAABBAB(2) 首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式(见表21)。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别,故选用配对四格表的McNemar检验(McNemars test for correlated proportions)进行统计分析。表2 20位患者治疗情况西米替丁胃舒氨合计有效无效有效aba+b无效cdc+d合 计a+cb+dN5.试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。甲、乙两医院乳腺癌手术后的5年生存率(%)腋下淋巴结 转 移甲 医 院乙 医 院病