1、南京大学医学院范怡梅南京大学医学院范怡梅第1页,共77页。统计学统计学(statistics):(statistics):“The science and art of dealing with The science and art of dealing with variation in data through collection,variation in data through collection,classification and analysis in such a way classification and analysis in such a way as to ob
2、tain reliable results.as to obtain reliable results.”第2页,共77页。医学统计学医学统计学(Medicine Statistics)(Medicine Statistics)是应用概率论和数理统计的基本原理和方法,结合医学实际阐述是应用概率论和数理统计的基本原理和方法,结合医学实际阐述统计设计的基本原理和步骤,研究资料或信息的收集、整理与分统计设计的基本原理和步骤,研究资料或信息的收集、整理与分析的一门学科。析的一门学科。是统计学在医学上的应用;是统计学在医学上的应用;理论基础是概率论和数理统计;理论基础是概率论和数理统计;SPSSSPSS
3、 Statistical Package for Social SciencesStatistical Package for Social Sciences Statistical Product and Service SolutionsStatistical Product and Service Solutions SASSAS Statistical Analysis SystemStatistical Analysis System作用;作用;统计工作的步骤。统计工作的步骤。第3页,共77页。研究设计(研究设计(research designresearch design)调查设计
4、、实验设计调查设计、实验设计资料收集(资料收集(data collectiondata collection)统计分析(统计分析(statistical analysis)statistical analysis)统计描述统计描述(statistical description)(statistical description)统计推断统计推断(statistical inference)(statistical inference)第4页,共77页。例例 某医生发明了一种新的治疗某病的疗法(治疗组),用现在公某医生发明了一种新的治疗某病的疗法(治疗组),用现在公用的疗法作为对照(对照组),经
5、临床试验,对照组与治疗组的疗用的疗法作为对照(对照组),经临床试验,对照组与治疗组的疗效分别为效分别为P P1 1=75%=75%与与P P2 2=95%=95%,问:能认为这两个有效率之间的差别,问:能认为这两个有效率之间的差别有显著性意义吗?有显著性意义吗?假设的假设的3 3批实验结果批实验结果组别组别例数例数有效率(有效率(%)疗效:疗效:有效有效 无效无效 合计合计甲实验甲实验 对照组对照组 治疗组治疗组乙实验乙实验 对照组对照组 治疗组治疗组丙实验丙实验 对照组对照组 治疗组治疗组1515191930303838454557575 51 110102 215153 320202020
6、404040406060606075.075.095.095.075.075.095.095.075.075.095.095.0第5页,共77页。甲实验中,甲实验中,c c2 2=1.765=1.765,P0.05P0.05,两个有效率两个有效率之间的差别无显之间的差别无显著性意义;著性意义;乙实验中,乙实验中,2 2=6.275=6.275,0.01 P 0.050.01 P 0.05,两个有效率两个有效率之间之间的差别有显著性意义;的差别有显著性意义;丙实验中,丙实验中,2 2=9.412=9.412,P 0.01P 0.01,两个有效率两个有效率之间的差别有极之间的差别有极显著性意义。显
7、著性意义。第6页,共77页。第7页,共77页。1.1.总体与样本总体与样本(population and sample)(population and sample)根据研究目的确定的同质观察单位的全体称为总体根据研究目的确定的同质观察单位的全体称为总体。从总体中随机抽取、进行研究的一部分个体所组成的集合从总体中随机抽取、进行研究的一部分个体所组成的集合,称为样本。,称为样本。要保证样本的可靠性、代表性。要保证样本的可靠性、代表性。2.2.同质与变异同质与变异(homogeneity and variation)(homogeneity and variation)统计研究的是有变异的事物,统
8、计分析的任务就是在同质统计研究的是有变异的事物,统计分析的任务就是在同质分组的基础上,通过对变异所呈现出来的统计规律性的研分组的基础上,通过对变异所呈现出来的统计规律性的研究,透过偶然现象,揭示同质事物的本质特征和规律。究,透过偶然现象,揭示同质事物的本质特征和规律。第8页,共77页。3.3.抽样误差抽样误差(sampling error)(sampling error)因抽样产生的样本与样本,样本与总体相应统因抽样产生的样本与样本,样本与总体相应统计指标之间的差异,称为抽样误差。计指标之间的差异,称为抽样误差。抽样误差的大小主要取决于观察单位间变异程度的大抽样误差的大小主要取决于观察单位间变
9、异程度的大小和样本含量的多少。小和样本含量的多少。4.4.参数和统计量参数和统计量(parameter and statistic)(parameter and statistic)总体的指标统称为参数,样本指标称为统计量总体的指标统称为参数,样本指标称为统计量。第9页,共77页。5.5.概率概率(probability)(probability)概率是描述随机事件发生的可能性大小的数值,常用概率是描述随机事件发生的可能性大小的数值,常用P P表示。表示。随机事件概率的大小在随机事件概率的大小在0 0与与1 1之间,即之间,即0 0 P P 1 1。习惯上将习惯上将P P 0.050.05,称
10、为小概率事件。,称为小概率事件。6 6统计资料的类型统计资料的类型定量资料定量资料分类资料分类资料如身高(如身高(cmcm)、体重()、体重(kgkg)等。)等。无序分类无序分类有序分类有序分类二项分类二项分类多项分类多项分类(等级资料(等级资料)如阳性与阴性、如阳性与阴性、治愈与未愈。治愈与未愈。如血型为如血型为A A、B B、ABAB、O O型。型。如治疗结果为治愈、显效如治疗结果为治愈、显效、好转、无效四级。、好转、无效四级。第10页,共77页。统计图表;统计图表;统计指标。统计指标。第11页,共77页。第12页,共77页。求极差求极差R=84-57=27(次(次/分)分)划分组段划分组
11、段确定组数:较大样本时,一般取确定组数:较大样本时,一般取10组左右。组左右。确定组距:极差确定组距:极差/组数组数=27/10=2.73(次(次/分)分)确定各组段的上下限:上限确定各组段的上下限:上限=下限下限+组距组距统计各组段内的数据频数,编制频数表统计各组段内的数据频数,编制频数表第13页,共77页。表表2.1 1302.1 130名健康成年男子脉搏(次名健康成年男子脉搏(次/分)的频数分布表分)的频数分布表脉搏组段脉搏组段 (1)频数频数(2)频率(频率(%)(3)累计频数累计频数 (4)累计频率(累计频率(%)(5)5659626568717477808385合计合计251215
12、252619151011301.543.859.2311.5419.2320.0014.6211.547.690.7727193459851041191291301.545.3814.6226.1545.3865.3880.0091.5499.23100.00第14页,共77页。可以揭示资料的分布类型和分布特征,以便于选用可以揭示资料的分布类型和分布特征,以便于选用相应的统计分析方法。相应的统计分析方法。便于进一步计算指标和统计处理。便于进一步计算指标和统计处理。便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。第15页,共77页。三种平均数三种平均数(average)(aver
13、age)算术均数算术均数(arithmetic mean)(arithmetic mean)几何均数几何均数(geometric mean)(geometric mean)中位数中位数(median)(median)第16页,共77页。简称均数,适合于表达呈正态分布资料的平均水平。简称均数,适合于表达呈正态分布资料的平均水平。直接法:直接法:例例2-22-2:=81+70+66+81+70+66+69+691313=71.69=71.69(次(次/分)分)11niniXXXXnnXX第17页,共77页。加权法加权法:例:例:=57.557.5 2+60.52+60.5 5+63.55+63.5
14、 12+12+84.5+84.5 1 1130130=71.62=71.62(次(次/分)分)iiif XXfX第18页,共77页。适用于原始数据分布不对称,但经对数转换后呈适用于原始数据分布不对称,但经对数转换后呈对称分布的资料。对称分布的资料。11211lg(lg)nnniiGX XXXn1lglg()iiifXGf第19页,共77页。例:例:4040名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑制抗体滴度,结果如表所示,求几何均数。制抗体滴度,结果如表所示,求几何均数。抗体滴度抗体滴度人数人数 f f滴度倒数滴度倒数 X XlgXlgX1:4
15、1:81:161:321:641:1281:2561:512145811641481632641282565120.60210.90311.20411.50511.80612.10722.40822.709311lg1 0.60214 0.90311 2.7093lg()lg()40iiifXGf 第20页,共77页。167.1282lg()48401:48G 第21页,共77页。适合于表达偏态资料、或分布不明的资料的平均水适合于表达偏态资料、或分布不明的资料的平均水平,尤其适合于表达只知数据的个数、但部分较大平,尤其适合于表达只知数据的个数、但部分较大或较小数据的具体数值未准确知道的资料的平
16、均水或较小数据的具体数值未准确知道的资料的平均水平。平。第22页,共77页。对于原始数据和频数分布表资料,分别用下列两式计算中位数。对于原始数据和频数分布表资料,分别用下列两式计算中位数。M=M=(X X n/2n/2+X+X(n/2+1n/2+1)/2 /2 (n n为偶数)为偶数)X X(n+1n+1)/2/2(n n为奇数)为奇数)其中,其中,L LM M :中位数所在组下限;:中位数所在组下限;i iM M :中位数所在组的组距;:中位数所在组的组距;f fM M :中位数所在组的频数;:中位数所在组的频数;f fL L:中位数所在组前一组的累计频数。:中位数所在组前一组的累计频数。(
17、)2MMLMinMLff第23页,共77页。例例2-4 2-4 表表2.3 1072.3 107正常人的尿铅含量(正常人的尿铅含量(g/Lg/L)的中位数计算表的中位数计算表含量(含量(g/L)(1)频数频数f(2)累计频数累计频数 f (3)累计频率累计频率%(4)0481216202428合计合计1422291815612107143665839810410510713.0833.6460.7577.5791.5997.2098.13100.00M=8+(107/2-36)=10.41(g/L)429第24页,共77页。例:设有三组同年龄、同性别儿童体重(例:设有三组同年龄、同性别儿童体重
18、(kgkg)数)数据如下:据如下:甲组甲组 26 28 30 32 3426 28 30 32 34乙组乙组 24 27 30 33 3624 27 30 33 36丙组丙组 26 29 30 31 34 26 29 30 31 34 第25页,共77页。描述离散程度的指标:描述离散程度的指标:极差、四分位数间距、方差、标准差及变异极差、四分位数间距、方差、标准差及变异系数。系数。第26页,共77页。为一组同质观察值中最大值与最小值之差。为一组同质观察值中最大值与最小值之差。甲组甲组 R=34-26=8R=34-26=8乙组乙组 R=36-24=12R=36-24=12甲组数据分布较乙组集中。
19、甲组数据分布较乙组集中。第27页,共77页。优点:计算简单优点:计算简单缺点:缺点:1.1.没有充分利用样本信息,只考虑最大值与最小值之差没有充分利用样本信息,只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度。异,不能反映组内其它观察值的变异度。2.2.样本含量越大,抽到较大或较小观察值的可能性越大样本含量越大,抽到较大或较小观察值的可能性越大,则极差可能越大,因此,样本含量悬殊时不宜用极差,则极差可能越大,因此,样本含量悬殊时不宜用极差比较分布的离散度。比较分布的离散度。所以,一般不用极差来反映离散程度。所以,一般不用极差来反映离散程度。第28页,共77页。第29页,共77页。1.
20、1.分位数的概念分位数的概念分位数是一种位置指标,一个特定的分位数将任何一个分位数是一种位置指标,一个特定的分位数将任何一个频数曲线下的面积分为两部分。频数曲线下的面积分为两部分。第第1 1四分位数记作四分位数记作Q Q1 1,第,第2 2、第、第3 3四分位数,分别记作四分位数,分别记作Q Q2 2、Q Q3 3;第;第1 1百分位数,记作百分位数,记作P P1 1。同理,还有第。同理,还有第2 2、第、第3 3、第第9999百分位数,分别记作百分位数,分别记作P P2 2、P P3 3、P P9999。显然,显然,Q Q1 1=P=P2525、Q Q2 2=P=P5050=M=M、Q Q3
21、 3=P=P7575第30页,共77页。2.2.百分位数百分位数(percentile)(percentile)的计算公式的计算公式对连续型变量频数表资料,按下式计算第对连续型变量频数表资料,按下式计算第X X百分位数百分位数P PX X:其中,其中,L LX X :第:第X X百分位数所在组下限;百分位数所在组下限;i iX X :第:第X X百分位数所在组的组距;百分位数所在组的组距;f fX X :第:第X X百分位数所在组的频数;百分位数所在组的频数;f fL L:第:第X X百分位数所在组前一组的累计频数。百分位数所在组前一组的累计频数。%(%)pLpiXLnpff第31页,共77页
22、。例例 某地某地200例正常成人血铅含量的频数分布如表所示,请计例正常成人血铅含量的频数分布如表所示,请计算出血铅含量的算出血铅含量的95%正常值范围。正常值范围。200例正常成人血铅含量的频数分布表例正常成人血铅含量的频数分布表 血铅含量血铅含量 频数频数 累计频数累计频数 (mol/L)(1)(2)00.240.480.720.971.211.451.691.932.172.422.662.903.14648433628131444120165497133161174188192196197199199200解:即求解:即求P95。nX%=20095%=190故某地正常人血铅含量故某地正常
23、人血铅含量95%的单的单侧正常值范围的上限为侧正常值范围的上限为 1.81(mol/L)。)。95%0.241.69(190 188)4X1.81(/)mol L第32页,共77页。3.3.四分位数间距(四分位数间距(quartile interval,Qquartile interval,Q)Q=PQ=P7575-P-P2525Q=QQ=QU U-Q-QL L优缺点:用四分位数间距作为描述数据分布离散程度的指优缺点:用四分位数间距作为描述数据分布离散程度的指标,比极差稳定,但仍未考虑到每个数据的大小,常用于标,比极差稳定,但仍未考虑到每个数据的大小,常用于描述偏态频数分布以及分布的一端或两端
24、无确切数值资料描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。的离散程度。第33页,共77页。例例2-10 据书中表据书中表2.3资料求四分位数间距资料求四分位数间距Q。P25=4+4 22(107 25%14)=6.32(g/L)P75=12+418(107 75%65)=15.39(g/L)Q=P75-P25=15.39-6.32=9.07(g/L)第34页,共77页。第35页,共77页。n-1称为自由度称为自由度221()niiXN221()1niiXXSn第36页,共77页。第37页,共77页。加权法加权法:21()niiXN2221()()/11niiXXXXnSnn2
25、2()/1fXfXfSf第38页,共77页。1.用于比较度量衡单位不同的多组资料的变异度。用于比较度量衡单位不同的多组资料的变异度。2.比较均数相差悬殊的多组资料的变异度。比较均数相差悬殊的多组资料的变异度。100%SCVX第39页,共77页。例例 某地不同年龄组男子身高(某地不同年龄组男子身高(cm)的变异程度)的变异程度年龄组年龄组33.5岁岁3035岁岁人数人数 100 100均数均数 96.1170.2标准差标准差 3.1 5.0变异系数变异系数 3.2%2.9%第40页,共77页。第41页,共77页。正态分布的图形:正态分布的密度函数:正态分布的图形:正态分布的密度函数:-X+通常用
26、通常用N(,2)表示均数为)表示均数为、方差为、方差为 2的正态分的正态分布。布。22()21()2Xf Xe第42页,共77页。1.正态曲线在横轴上方均数处最高;正态曲线在横轴上方均数处最高;2.正态分布以均数为中心,左右对称;正态分布以均数为中心,左右对称;3.正态分布有两个参数,即均数正态分布有两个参数,即均数 与标准差与标准差。是是位置参数,当位置参数,当 固定不变时,固定不变时,越大,曲线沿横轴越大,曲线沿横轴越向右移动;越向右移动;越小,曲线沿横轴越向左移动。越小,曲线沿横轴越向左移动。是变异度参数,当是变异度参数,当 固定不变时,固定不变时,越大,曲线越越大,曲线越平阔;平阔;越
27、小,曲线越尖峭。越小,曲线越尖峭。4.正态曲线下的面积分布有一定的规律。正态曲线下的面积分布有一定的规律。第43页,共77页。常用的两个区间:常用的两个区间:1.96 及及 2.58 的区间面积分别占总面积(或的区间面积分别占总面积(或总观察例数)的总观察例数)的95%及及99%,如下图所示:,如下图所示:95%2.5%2.5%-1.96 +1.96 99%-2.58 +2.58 0.5%0.5%第44页,共77页。令令-u+用用N(0,1)表示标准正态分布)表示标准正态分布Xu221()2uue第45页,共77页。制定医学参考值范围制定医学参考值范围(medical reference ra
28、nge)许多统计方法的理论基础许多统计方法的理论基础第46页,共77页。参考值范围的制定参考值范围的制定正态分布法正态分布法 百分位数法百分位数法%909599 单单只有下限只有下限 侧侧只有上限只有上限双侧双侧P5P95P2.5P97.5P0.5P99.5 单单只有下限只有下限P10P5P1侧侧只有上限只有上限 P90 P95 P991.64XS1.96XS2.58XS1.28XS1.64XS1.64XS1.28XS2.33XS2.33XS第47页,共77页。例例 出生体重低于出生体重低于25002500克为低体重儿。若由某项研究得某克为低体重儿。若由某项研究得某地婴儿出生体重均数为地婴儿出
29、生体重均数为32003200克,标准差为克,标准差为350350克,估计该克,估计该地当年低体重儿所占的比例。地当年低体重儿所占的比例。第48页,共77页。补充题补充题 以下是以下是101名名30-49岁正常成年男子的血清总胆固醇(岁正常成年男子的血清总胆固醇(mmol/L)测定值的频数表,)测定值的频数表,请据此资料请据此资料:(:(1)选择适当的集中趋势指标并计算之;()选择适当的集中趋势指标并计算之;(2)选择适当的离散程)选择适当的离散程度指标并计算之;(度指标并计算之;(3)求该地)求该地30-49岁健康男子血清总胆固醇的正常值范围;岁健康男子血清总胆固醇的正常值范围;(4)估计该地
30、)估计该地30-49岁健康男子血清总胆固醇值小于岁健康男子血清总胆固醇值小于4.50 mmol/L的概率。的概率。血清总胆固醇血清总胆固醇2.53.03.54.04.55.05.56.06.57.07.5合计合计频数频数f1892325179621101fx2.752633.7597.75118.7589.2551.7537.513.57.25478.25fx27.5684.50126.56415.44564.06468.56297.56234.3891.1352.562342.31第49页,共77页。第50页,共77页。从样本获取有关总体信息的过程称为统计推断从样本获取有关总体信息的过程称为
31、统计推断(statistical inference)(statistical inference)。由个体差异产生的,抽样造成的样本与样本、样本与由个体差异产生的,抽样造成的样本与样本、样本与总体相应统计指标之间的差异,称为抽样误差总体相应统计指标之间的差异,称为抽样误差(sampling error)(sampling error)。第51页,共77页。标准误(standard error,SE):样本统计量的标准差。均数的标准误(SEM,):即样本均数的标准差。样本观测值的标准差与样本均数的标准误的比较:1.标准差与标准误都反映数据的离散性;2.标准差的大小反映各个个体的观测值X之间的变
32、异 程度(离散程度),标准误的大小反映各个样本均 数 间的变异程度(离散程度),也反映了样本均 数代表总体均数的可靠性。XX第52页,共77页。数理统计推出:1.从正态总体N(,2)中,随机抽取例数为n的样本,样本均数 也服从正态分布;即使从偏态总体随机抽样,当n足够大时,也近似正态分布;2.从均数为,标准差为的正态或偏态总体,抽取例数为n的样本,样本均数 的总体均数也为,标准差用 表示,则 可按下式计算:XXXXXXn第53页,共77页。2(,)XNn2(,)XN XnXSSn第54页,共77页。第55页,共77页。(一)(一)t t分布的概念分布的概念第56页,共77页。,即u分布。用S代
33、替,得到 t分布2(,)XN 2(,)XNn2(0,)XNn(0,1)/XNn/XSn第57页,共77页。以以0 0为中心,左右对称的单峰分布;为中心,左右对称的单峰分布;t t分布曲线是一簇曲线,其形态变化与自由度分布曲线是一簇曲线,其形态变化与自由度 的大的大小有关。小有关。自由度自由度 越小,则越小,则t t值越分散,曲线越低平;值越分散,曲线越低平;自由度自由度 逐渐增大时,逐渐增大时,t t分布逐渐逼近分布逐渐逼近u u分布;当分布;当=时,时,t t分布即为分布即为u u分布。分布。t t分布曲线下总的面积等于分布曲线下总的面积等于1 1,即,即t t值落入区间(值落入区间(-,)
34、内的概率为)内的概率为1 1。t t值落入任一区间值落入任一区间 (t t1 1,t t2 2)内的概率等于该区间内曲线和横坐标轴所夹的)内的概率等于该区间内曲线和横坐标轴所夹的面积。面积。第58页,共77页。附表2 t界值表通式:单侧:P(t -t,)=,或P(t t,)=双侧:P(t -t/2,)+P(t t/2,)=图中非阴影部分面积的概率为:P(-t/2,t t/2,)=1-第59页,共77页。参数估计是指用样本指标值估计总体指标值。参数估计是指用样本指标值估计总体指标值。包括点估计和区间估计。包括点估计和区间估计。第60页,共77页。点估计:就是用样本统计量直接作为总体参数的估计值。
35、区间估计:即按预先给定的概率(1-)确定包含未知总体参数的可能范围。该范围称为参数的可信区间或置信区间,预先给定的概率称为可信度或置信度,常取95%或99%。可信区间的确切含义指的是:有1-的可能认为计算出的可信区间包含了总体参数。第61页,共77页。总体均数可信区间(confidence interval)的计算:1.未知:按t分布。由于P(-t/2,t t/2,)=1-,/2/2SSXtXtnn,/2/2/XttSn,第62页,共77页。2.已知或未知但n足够大时:按u分布双侧可信区间为:()或()/2Xun/2SXun第63页,共77页。均数的可信区间与参考值范围的区别:1.意义不同均数
36、的可信区间的统计意义:(1)按预先给定的概率,确定的包含总体均数的可能范围,因此它用于估计总体均数。(2)可信度要高,但精度不能下降。参考值范围的统计意义:“正常人”的解剖、生理、生化某项指标的波动范围,可以用于判断观察对象的某项指标正常与否。2.两者的计算公式有差别:可信区间用了标准误,参考值范围用了标准差。第64页,共77页。补充题 152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和95%区间估计。152例麻疹患儿病后血清抗体滴度倒数的分布滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计人 数 0 0 1 7 10 31 33 4
37、2 24 3 1 152第65页,共77页。Data EditorData EditorViewerViewerSyntax Editor Script第66页,共77页。例例2.1 View Variable:View Data:第67页,共77页。变量名最长不超过变量名最长不超过64个字节个字节;首字符必须是字母或汉字首字符必须是字母或汉字,不能以不能以_或或.结尾结尾;变量名中不能有空格或某些特殊符号变量名中不能有空格或某些特殊符号,如如!?*;变量名不能与变量名不能与SPSS的关键字相同的关键字相同,如如ALL,AND,BY,EQ,GE,GT,LE,LT,NE,NOT,OR,TO,WI
38、TH等等;对变量名英文字母的大小写不作区分对变量名英文字母的大小写不作区分.第68页,共77页。Analyze Descriptive StatisticsFrequenciesVariable:xStatistics Percentile Values:Quartiles Central Tendency:Mean;Median Dispersion:Std.deviation Distribution:Skewness ContinueCharts Histogram ContinueFormat Order by:Ascending ContinueOK频数分布分频数分布分析析:第69页
39、,共77页。StatisticsX130071.32.50972.0070a5.80233.659-.139.212-.542.422275784927164.0066.0067.0068.3070.0072.0073.0075.0076.0076.8079.00ValidMissingNMeanStd.Error of MeanMedianModeStd.DeviationVarianceSkewnessStd.Error of SkewnessKurtosisStd.Error of KurtosisRangeMinimumMaximumSum1020253040506070758090P
40、ercentilesMultiple modes exist.The smallest value is showna.X85.082.580.077.575.072.570.067.565.062.560.057.5XFrequency3020100Std.Dev=5.80 Mean=71.3N=130.00第70页,共77页。One-Sample Kolmogorov-Smirnov Test13071.325.802.060.051-.060.689.730NMeanStd.DeviationNormal Parametersa,bAbsolutePositiveNegativeMost
41、 ExtremeDifferencesKolmogorov-Smirnov ZAsymp.Sig.(2-tailed)XTest distribution is Normal.a.Calculated from data.b.正态性检验:正态性检验:Analyze Nonparametric Tests 1-Sample Kolmogorov-Smirnov TestTest Variable List:xTest Distribution:NormalOK第71页,共77页。练习练习 2.2 View Variable:View Data:第72页,共77页。TransformCompute
42、Target Variable:logxMumeric Expression:lg10(x)OKData Weight CasesWeight Cases by Frequency Variable:fOKAnalyze Descriptive Statistics DescriptivesVariable:logxOK第73页,共77页。可信区间:补充题 View Variable:View Data:第74页,共77页。Transform Compute Target Variable:logxNumeric Expression:LG10(x)OKData Weight Cases We
43、ight Cases by Frequency Variable:fOKAnalyze Descriptive Statistics ExploreDependent list:logxDisplay:StatisticsStatistics:DescriptivesContinueOK第75页,共77页。第76页,共77页。教材:教材:余松林余松林.医学统计学医学统计学.人民卫生出版社,人民卫生出版社,2002.32002.3第第1 1版版.参考文献:参考文献:颜虹颜虹.医学统计学医学统计学.人民卫生出版社,人民卫生出版社,2010.82010.8第第2 2版版.陈平雁陈平雁.SPSS13.0统计软件应用教程统计软件应用教程.人民卫生出版社,人民卫生出版社,2005.9.第第1版版.第77页,共77页。