1、第二讲第二讲 第第一节、医学统计学的基本概念和步骤一节、医学统计学的基本概念和步骤 第第二节、数值变量的统计描述及二节、数值变量的统计描述及SPSS操作操作 第第三节、数值变量的总体均数估计三节、数值变量的总体均数估计 第第一节一节 统计学基本概念和步骤统计学基本概念和步骤一一 总体和总体和样本(样本(population and sample)概念:概念:总体-根据研究目的确定的同质观察单位的全体。样本-总体中随机抽取有代表性的一部分 个体,其实测值的集合。例如例如:从某地2004年7岁正常女童中,随机抽取110名女童进行身高测量。总体是指该地2004年所有7岁正常女童的身高值的集合。样本是
2、指所测量的这110名女童的身高值。同质-同年同地7岁正常女童 变异-样本中的女童身高值各不相同 二、二、随机抽样(随机抽样(random sampling)概念概念:随机抽样,就是总体中每个个体都有均等机会被抽取进入样本。目的目的:使得样本能更好地代表总体,可以根据样本信息推断总体特征 三、三、参数和统计量(参数和统计量(parameter and statistic)概念:概念:-参数是指总体指标,如总体均数(),总体标准差(),总体率()等。-统计量是指样本指标,如样本均数,样本标准差(s),样本率(p)等。一般情况下,参数是未知的,需要用统计量去估计。四、四、误差(误差(error)医学
3、科学研究中的误差通常指测量值与真值之差,其中包括系统误差和随机测量误差;以及样本指标与总体指标之差,即抽样误差。研究抽样误差的规律,是医学统计的重要内容之一。误差 解释 解决办法系统误差 不是偶然机遇所致,尽可能避免,或通过周(systematic 而是某种必然因素所致,密的研究设计解决 error)具有一定的倾向性随机测量误差 偶然机遇所致,是不可避免的 控制在一定的允许范围(random measurement error)内,数据仍可以使用 抽样误差 抽样研究中,即使消除了 可以通过统计方法估计(sampling error)系统误差,控制 了随机测量 并减小 误差,样本指标和总体参数间
4、 仍会存在差别。这是由个体变 异造成,是抽样波动所致,不可避免的 五、五、医学统计资料的类型医学统计资料的类型 医学统计资料是由医学科学研究产生的一系列观测结果组成,用于反映观测结果的属性或标志,统计上称为变量(variable),对变量的测量或观察结果称为变量值(value of variable)统计资料的类型统计资料的类型资料类型资料类型 变量类型变量类型 例子例子 统计指标统计指标 计量资料 数值变量数值变量 身高(cm),体重(kg)平均数,标准差等计数资料 分类变量分类变量 治疗40个病人的效果:率,有效:27例 构成比等 无效:13例 等级资料 有序分类有序分类 治疗40个病人的
5、效果:可计算构成比 变量变量 显效:13例 好转:30例 无效:27例 例例1:某地某年:某地某年120名名20岁健康男大学岁健康男大学生身高生身高(cm)它是一个样本数据(book1.xls),所对应的总体是该地该年所有20岁健康男大学生身高例例2:某年某地正常成人血铅某年某地正常成人血铅(微克微克/100克克)资料资料 第二节二节 数值变量的统计描述及数值变量的统计描述及SPSS操作操作 数值变量的数据分布特征数值变量的数据分布特征 -作频数表(frequency table)-直方图(histogram)根据数据分布类型计算统计指标根据数据分布类型计算统计指标 -集中趋势指标(平均指标)
6、-离散趋势指标(变异指标)统计指标的应用统计指标的应用 -计算个体变量值的范围 (医学参考值范围)一、频数分布一、频数分布 数据的分布类型数据的分布类型 -对称分布对称分布(正态分布)(正态分布)-偏态分布偏态分布 进行数据核查,发现异常值和进行数据核查,发现异常值和 missng值值V1(Banded)V1(Banded)32.52.52.532.52.55.0108.38.313.31310.810.824.21815.015.039.22823.323.362.52016.716.779.2119.29.288.397.57.595.843.33.399.21.8.8100.012010
7、0.0100.0 frequencies-statisticsDescriptive statistics-descriptives-optionsDescriptive StatisticsDescriptive Statistics120172.684.17817.453120V1Valid N(listwise)NMeanStd.Deviation VarianceDescriptive statistics-explore-display statisticsDescriptivesDescriptives172.68.381171.93173.44172.71172.4017.453
8、4.178161183225-.072.221-.028.438MeanLower BoundUpper Bound95%ConfidenceInterval for Mean5%Trimmed MeanMedianVarianceStd.DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisV1Statistic Std.Error例例3:有:有69例类风湿关节炎(例类风湿关节炎(RA)患)患者血清者血清EBV-VCA-IgG抗体滴度资料抗体滴度资料(book1.xls sheet3),求其平均滴度,求其平均滴度步骤:将
9、滴度倒数和例数输入SPSS,进行数据加权(WEIGHT CASES)后,点击analyze-report-case summaries-选入滴度倒数选入滴度倒数-statistics里要求输出倒数第3个指标,几何均数几何均数作业作业对例2的资料进行描述统计,问1)血铅原始值是什么分布类型的资料2)选用何种指标反映其集中、离散趋势3)血铅对数值是什么分布类型的资料4)试采用几何均数反映资料的平均水平要求:说明原因,写出计算公式和结果三、三、正态分布及其应用正态分布及其应用 正态分布及正态曲线下面积的分布规律正态分布及正态曲线下面积的分布规律正态分布及其应用正态分布及其应用 正态分布及正态曲线下面
10、积的分布规律正态分布及正态曲线下面积的分布规律正态分布的特征正态分布的特征1)以均数为中心,左右对称,钟型曲线2)均数决定整个曲线的位置,标准差决定 曲线的胖瘦,是正态分布两个重要参数3)均数处最高,说明变量值易在附近出现4)正态曲线下一定区间的面积,说明变量 值在这个区间里出现的可能性,有规律 要求记住95%,99%对应的区间公式正态分布及其应用正态分布及其应用 正态分布及正态曲线下面积的分布规律正态分布及正态曲线下面积的分布规律正态分布及其应用正态分布及其应用 估计观察值所在范围估计观察值所在范围 (医学参考值范围医学参考值范围)95%的健康成人血糖观察值所在范围的健康成人血糖观察值所在范
11、围:例例:n=132,x=4.653(mmol/L)s=0.401(mmol/L),x 1.96 s=x-1.96 s=4.653-1.96 0.401 x+1.96 s=4.653+1.96 0.401=3.87 5.44(mmol/L)即该地 95%的5558岁健康健康成人血糖观察值在 3.87 5.44(mmol/L)范围内标准正态分布概念和特征标准正态分布概念和特征 均数为0,标准差为1的正态分布称为标准正态分布(z分布)。若X服从正态分布,经z变换公式,所得的z值服从标准正态分布。正态曲线有无数条,但标准正态分布曲线只有一条。标准正态分布具有正态分布的所有特征尤其要记住95%,99%
12、对应的区间。xzDescriptive statistics-descriptives-save standard value as variable如何判断资料是否服从正态分布如何判断资料是否服从正态分布 对样本例数较大的资料,编频数表和绘直方图,另外还可以点击 正态Q-Q图看散点是否与直线重合,正态性检验看是否Sig值(即P值)是否大于0.10 对例数较小的资料,一般根据专业知识或着仅仅是假定Descriptive statistics explore-display plots-plots:nomality plots with tests 第三节三节 数值变量的总体均数估计数值变量的总
13、体均数估计 均数的抽样误差与标准误均数的抽样误差与标准误 来自同一总体的各样本均数间存在差异,称为均数的抽样误差。标准误是反映均数的抽样误差大小的指标,它与样本含量n的平方根成反比。即适当增加n可以减少均数的抽样误差。n-x理论值理论值nss-x估计值估计值 总体均数的估计总体均数的估计 统计分析包括统计描述和统计推断两部分,而统计推断包括参数(如总体均数)估计和假设检验。总体均数估计包括点估计和区间估计,常计算总体均数的95%置信区间,可以认为该可以认为该区间包含总体均数的结论错误的可能性是区间包含总体均数的结论错误的可能性是5%-x/2,stx未知时的公式未知时的公式 未知未知n较大时较大时-x96s.1x问题:问题:95%医学参考值范围和总体均数95%置信区间的区别是什么?
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。