1、 医学统计学第一章 绪论一、名词解释:1. 同质与变异2. 总体和样本3. 参数和统计量4. 抽样误差5. 概率6. 计量资料7. 计数资料8. 等级资料二、是非题:1用定性的方法得到的资料称作数值变量资料,亦称作计数资料。 ( )2观察某人群的血型,以人为观察单位,结果分为A型、B型、AB型和O型,是有序 分类资料。 ( ) 3分类变量或称定量变量,其变量值是定量的,表现为数值大小,一般有度量衡单位,亦称计量资料。 ( )4调查某地10岁女孩的身体发育状况,以人为观察单位,测得每个人的身高(cm)、 体重(kg)、血 压(mmHg),此资料称为多项分类变量资料。 ( )5用定量的方法测定观察
2、单位某个量的大小的资料,称数值变量资料。 ( )7等级分组资料兼有计数与计量资料的性质。 ( )8将观察单位按某一属性的不同程度分组计数,所得各组的观察单位称为计数资料。 ( )三、单选题:1. 计量资料计数资料和等级分组资料的关系有 C A.计量资料兼有计数资料和等级分组资料的一些性质 B.计数资料兼有计量资料和等级分组资料的一些性质 C.等级分组资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.等级分组资料又可叫半计数资料2. 为了由样本推断总体,样本应该是 E A.总体中任意一部分 B.总体中的典型部分 C总体中有意义的一部分 D.总体中有价值的一部分 E.总体
3、中有代表性的一部分3. 统计学上所说的系统误差测量误差和抽样误差三种误差,在实际工作中有 D A.三种误差都不可避免 B.系统误差和测量误差不可避免 C.系统误差和抽样误差不可避免 D.测量误差和抽样误差不可避免 E.三种误差都可避免4. 抽样误差指的是 C A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D. 总体参数值和总体参数值之差5. 医学统计工作的基本步骤是 D A 调查资料校对资料整理资料 B调查资料归纳资料整理资料 C收集资料校对资料整理资料 D收集资料整理资料分析资料 E收集资料校对资料归纳资料6. 统计学中所说的总体是指 B A任意
4、想象的研究对象的全体 B根据研究目的确定的研究对象的全体C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。(5) 概率:是描述
5、随机事件发生的可能性大小的数值,用p表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。是非题:1. 2. 3. 4. 5. 6. 7. 单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布一、 名词解释:平均数标准差标准正态分布参考值范围二、 填空题:1、 医学统计资料按研究指标的性质分为_、_和_三类。2、 统计工作的全过程按顺序可分为四个步骤,即_、_、_和_。3、 正态分布用N(,
6、2)表示,为了应用方便,常对变量X作_变换,使=0 ,=1,则正态分布转变为_分布,用_表示。4、 正态曲线下面积的分布有一定规律,理论上_、_和_,区间的面积(观察单位数)各占总面积(总观察单位数)的_、_和_可用于估计医学参考值范围和质量控制方面。5、 标准正态曲线下,区间(-1.96,0)的面积占总面积的_%。6、 用_和_可全面描述正态分布资料的特征。7、 为了说明离散程度应选用变异指标,常用的变异指标有_、_、_和_。8、 _范围内的面积占正态曲线下总面积的95%。9、 样本值中最大值与最小值之差,称为这个样本的_记_。10、 通常把称为_或_而将uu 1(/2)的区域称作拒绝域,一
7、般取_有时_或_。11、 正常值范围的意义是指绝大多数正常人的变量均在此范围中,这个绝大多数习惯上包括正常人的_、_、_、_而最常用的是_。12、 对于正态分布的资料,在1.96,2.58区间内的变量值,其出现的概率 分别为_和_。13、 频数分布的两个重要特征是指_和_,可全面地分析所研究的 事物。14、 偏态分布资料宜计算_以表示其平均水平。15、 平均数的计算和应用必须具备_、 _,否则平均数是没有意 义。16、 正态分布有以下的特征 正态曲线在横轴上方,且_所处在最高。 正态分布以_为中心左右对称。 正态分布有两个参数即_和_。 正态分布的面积有一定的_。17. 描述一组正态分布资料的
8、变异度,以_指标为好。18. 变异系数CV常用于比较_或_的两组或多组资料的变异程度三、 是非题:1平均数是一类用于推断数值变量及资料平均水平(或集中趋势)的指标。 ( )2反映频数分布的两个重要特征是集中趋势与散离趋势 。 ( )3标准差是最常用的变异指标,它既可以用于正态资料亦可用于非正态资料。 ( )4计算中位数时要求组距相等。 ( )5计量单位相同,均数相差不大时,可使用变异系数反应两组变量值的离散程度。( )6变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。 ( )7百分位数应用中提到,分布中部的百分位数相当稳定具有较好的代表性,但靠近两 端的百分位数只在样本例数足够多
9、时才比较稳定。 ( )8.为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资 料的分布特征以及分布类型。 ( )9如果少数几个数据比大部分数据大几百倍一般就不宜计算均数 ( )10原始数据有零,就不能直接计算几何均数 ( )11正态分布是以均数为中心的钟型分布 ( )12高峰位于中央,两侧逐渐下降并完全对称的频数分布即为正态分布 ( )13理论上,对于正态分布资料的P5-P95和1.96S范围内都包含有95%的变量值。 ( )14制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排影响被研 究指标的各种疾病的人 ( )15描述频数分布离散程度的最常用的指标是变异
10、系数和标准差 ( )16正态分布用N(0,1)表示,为了应用方便,常对变量X作u=(x-)/变换, 使=0 =1则将正态分布转换为标准正态分布用N(,2)表示 ( )17只要单位相同,用标准差和用变异系数来比较两组变量值的离散度结论是完全一致的 ( )18四分位数间距Q=P75P25,常用于描述近似正态分布资料的离散程度 ( )19频数表和频数分布图用以推断变量值的分布特征和揭示变量值的分布规律 ( )20制定正常值范围,如取95%界限,是指95%的正常人本项指标在此范围 ( )21指标无论过高或过低均属异常,可用来计算正常值范围 ( )四、 单选题:1.以年龄(岁)为例,最常用的组段表示法是
11、 B 05, 510,1015, 1520;0, 5,10, 15;0, 59, 1014, 1519; 5, 10, 15, 20;以上都不是;2.以下指标中_可用来描述计量资料离散程度。D算术平均数几何均数中位数标准差 第50百分位数3.偏态分布资料宜用_描述其分布的集中趋势。C算术平均数标准差中位数四分位数间距方差4.用均数和标准差可全面描述_资料的分布特征。A A正态分布B正偏态分布C负偏态分布D对称分布E任何计量资料分布5._可用于比较身高与体重的变异度CA方差B标准差C变异系数D全距E四分位数间距D 6.各观察值均加(或减)同一个数后,_。E举例算一下 A. 均数不变,标准差不一定
12、变 B. 均数不变,标准差变C. 均数不变,标准差也不变 D. 均数变,标准差不变E. 均数变,标准差也变7.各观察值同乘以一个不等于0的常数后,_不变E。A. 均数 B. 标准差 C. 几何均数D. 中位数 E. 变异系数A 8._的资料,均数等于中位数。C 看错选项? A. 对称 B. 正偏态 C. 负偏态 D. 对数正态 C 9.最小组段无下限或最大组段无上限的频数分布表资料,可用描述其集中趋势。DA均数 B标准差C中位数D四分位数间距 E几何均数10.描述一组偏态分布资料的变异度,以_D_指标较好.A. 全距(R) B. 标准差(s) C. 变异系数(CV) D. 四分位数间距 (u-
13、L)11.计算某抗体滴度的平均水平,一般选择 B A算术均数 B几何均数C中位数 D标准差 E标准误12.计算某病的平均潜伏期,一般选择 B(观察值不能为0,同时有正负) CA算术均数 B几何均数C中位数 D标准差 E变异系数C 13.表示正态分布资料个体变量值的变异程度的常用指标是 C E A均数 B全距 C标准差D标准误 E变异系数(多组间单位不同或均数相差较大)14.平均数是表示 C A.性质相同的变量值的相对水平 B.性质相同的变量值的实际水平 C.性质相同的变量值的平均水平 D.性质不同的变量值的平均水平 E.性质相同的变量值的变异程度15.用变异系数比较变异程度,适于 A A 两组
14、观察值单位不同,或两均数相差较大 B 两组观察值单位相同,标准误相差较大 C 两均数相差较大,标准误相差较大 D 以上都不是16.正偏态资料计算平均水平,首选 C A.算术均数 B.几何均数 C.中位数 D.加权均数 E.百分位数E 17.均数与标准差的关系是A E 均数标准误的大小与原变量的标准差成正比 A均数越大,标准差越大 B均数越大,标准差越小 C标准差越大, 均数代表性越好 D标准差越小, 均数代表性越差 E标准差越小, 均数代表性越好(只是均数和标准误的关系!)18.有8名某传染病患者,潜伏期分别为:2,1,21,7,12,1,4,13天。其平均潜伏期为 C 天。 A4 B5.5
15、C7 D 12 E9.519.五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种指标比较两组数据变异大小为宜D(多组间单位不同或均数相差较大) AS BS C全距 DCV E自由度C 20.调查50例链球菌咽峡炎患者潜伏期如下, 为计算均数平均数,应首选 A 潜伏期 12 24 36 48 60 72 84 96 108120 合计 病例数 1 7 11 11 7 5 4 2 2 50A 算术均数 B 几何均数 C 中位数D 百分位数 E. 以上均可以21. 102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用 B 抗体滴度 1
16、100 1200 1400 1800 11600 合 计人数 7 19 34 29 13 102A. 算术均数 B. 几何均数 C. 中位数 D. 百分位数 E. 以上均可以 22.对于均数标准差为的正态分布,95%的变量值分布范围为 B A.-+ B.-1.96+1.96 C.0+1.96 D.-+1.96 E.-2.58+2.58E 23.若u服从均数为0,标准差为1的正态分布,则 A A.u2.58的P=0.01 B.u2.58的P=0.005 C.-2.58u2.58的P=0.01 D.u2.58的P=0.05 E. u2.58的P=0.025(双侧)24.正态分布有两个参数与,_C_
17、曲线的形状越扁平。 A. 越大 B. 越小 C. 越大 D. 越小 E. 与越接近0A 25.对数正态分布是一种_B_分布 A. 正态 B. 近似正态 C. 左偏态 D. 右偏态 E. 对称26.正态分布曲线下,横轴上,从均数到+的面积占总面积的比例为_C_ A97.5% B95% C50% D5% E不能确定(与标准差的大小有关)27.标准正态分布的均数与标准差分别为_B_ A. 0与1 B. 1与0 C. 0与0 D. 1与1 E. 1.96与2.58D 28.若X服从以,为均数和方差的正态分布,则X的第95百分位数即_E_ A. -1.64 B. -1.96 C. + D. +1.64
18、E. +1.96D 29.若正常成人的血铅含量X服从近似对数正态分布,则可用公式_E_制定95%正常 值范围。(其中:=log) A. +1.96 B. +1.64 C. +1.64Y D. log-1 (+1.64Y) E. log-1 (+1.96Y)D 30.正态分布曲线下,横轴上,从均数到+1.96倍标准差的面积为_A_ A95% B45% C97.5% D47.5%(50-2.5)画图A 31.标准正态分布曲线下中间90%的面积所对应的横轴尺度u的范围是D (画图) A. 1.645到+1.645 B. -到+1.645 C. 到+1.282 D. 1.282到+1.28232.设X
19、符合均数为标准差为的正态分布,作u=的变量变换则 E A.符合正态分布,且均数不变 B.符合正态分布,且标准差不变 C.u符合正态分布,且均数和标准差都不变 D.u不符合正态分布 E.u符合正态分布,但均数和标准差都改变 33.正态分布是以 D A.标准差为中心的频数分布 B.t值为中心的频数分布 C.组距为中心的频数分布 D.均数为中心的频数分布 E.观察例数为中心的频数分布34.用变异系数比较变异程度,适于 A A 两组观察值单位不同,或两均数相差较大 B 两组观察值单位相同,标准误相差较大 C 两均数相差较大,标准误相差较大 D 以上都不是D 35.决定个体值正态分布的参数是 C A变异
20、系数 B全距 C标准误 D标准差 E以上都不是 36.正态分布是以 D A.标准差为中心的频数分布 B.t值为中心的频数分布 C.组距为中心的频数分布 D.均数为中心的频数分布 E.观察例数为中心的频数分布37正偏态资料计算平均水平,首选 C A.算术均数 B.几何均数 C.中位数 D.加权均数 E.百分位数38均数与标准差的关系是 E A均数越大,标准差越大 B均数越大,标准差越小 C标准差越大,均数代表性越好 D标准差越小,均数代表性越差 E标准差越小,均数代表性越好D? 39计量资料的标准差 A.不会比均数大 B.不会比均数小 C.要比标准误小 D.不决定于均数 E.以上都不对B 40有
21、9名某传染病人,潜伏期分别为(天):2,1,21,7,12,1,4,13,24其平均潜伏期为 C (几何均数) A4 B5.5 C7 D 12 E9.541表示变异程度的指标中 C A标准差越大,变异程度越小 B标准差越小,变异程度越大 C变异系数越大,变异程度越大 D变异系数越大,变异程度越小 E全距越大,变异程度越小42正态资料的变异系数应 B A一定1 B一定1 C可能1,也可能1 D一定标准差 E一定标准差D 43五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种方式说明两组数据变异大小 B AS BS C全距 DCV E自由度C 44
22、调查50例链球菌咽峡炎患者潜伏期如下 潜伏期 1224364860728496108120 合计病例数 1 7 11 11 7 5 4 2 2 50求平均潜伏期,应首选 B (常用的平均数有三种:算数均数、几何均数、中位数) A算术均数(患者例数较多) B几何均数(不属于对数正态分布) C 中位数(方便快捷) D 百分位数 E. 以上均可以45102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用 B 抗体滴度 1100 1200 1400 1800 11600 合 计人数 7 19 34 29 13 102 A. 算术均数 B. 几何均数 C. 中位数 D. 百分位数 E. 以
23、上均可以五、 问答题:1均数几何均数和中位数的适用范围有何异同?2中位数与百分位数在意义上计算和应用上有何区别与联系?3同一资料的标准差是否一定小于均数?4测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?5正态分布标准正态分布与对数正态分布在概念上和应用上有何异同?6医学中参考值范围的含义是什么?确定的原则和方法是什么?7对称分布资料在“均数1.96倍标准差”的范围内,也包括95%的观察值吗?六、 计算题1. 某地101例3049岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69
24、 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.07 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.86 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16
25、 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.04 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05 (1)编制频数分布表并绘制直方图,简述其分布特征。 (2)计算均数、标准s、变异系数CV。 (3)计算中位数M,并与均数比较, (4)计算P2.5及P97.5并与1.96s的范围比较。 (5)分别考察1S、1.9S6、2.58S范围内的实际频数与理论分布是否基本一致? (6)现
26、测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地3049岁健康男子中,还有百分之几的人血清总胆固醇值比他高?2. 某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑 制抗体滴度资料如表。 表2-1: 平均滴度计算表 抗体滴度 人数f 1:8 2 1:16 6 1:32 5 1:64 10 1:128 4 1:256 2 1:512 1 合计 30 (1) 试计算其平均滴度。 (2) 有人发现本例用抗体滴度稀释倍数和直接用滴度倒数算得几何标准差的对数 值相同,为什么?3. 50例链球菌咽峡炎患者的潜伏
27、期如表,说明用均数、中位数或几何均数,何者 的代表性较好?并作计算。 表2-2: 50例链球菌 咽峡炎患者的潜伏期 潜伏期(小时) 病例数f 12 1 24 7 36 11 48 11 60 7 72 5 84 4 96 2 108120 2 合计 50 4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查 了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含 量如表: 表2-3:238人发汞含量频数计算表 发汞值 人数f (mol/kg) 1.5 20 3.5 66 5.5 60 7.5 48 9.5 18 11.5 16 13.5 6 15
28、.5 1 17.5 0 19.521.5 3 合计 238 (1)说明此频数分布的特征, (2). 计算均数和中位数,何者较大?为什么?何者用于说明本资料的集中位置较合 适? (3). 选用何种指标描述其离散程度较好? (4). 估计该地居民发汞值的95%参考值范围答案名词解释:1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。填空题
29、:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。3. (变量变换)标准正态分布、0、14. 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. 9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
30、16. 17. 18. 19. 20. 21. 单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C10. D11. B12. C13. C14. C15. A16. C17. E18. C19. D20. C21. B22. B23. E24. C25. A26. C27. B28. D29. D30. D31. A32. E33. D34. A35. D36. D37. C38. E39. D40. B41. C42. B43. D44. C45. B问答题:1均数几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平 均 数 意 义 应用场合 均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布几何均数 平均增减倍数 等比资料;对数正态分布资料 中位数 位次居中的观 偏态资料;分布不明资料;分布一端或两察值水平 端出现不确定值 2中位数