1、1卫生统计学基本概况和基本概念卫生统计学基本概况和基本概念2教学要点统计学统计学Statistics的定义的定义1医学中的统计医学中的统计2基本概念基本概念3如何学好卫生统计如何学好卫生统计4考试要求考试要求53统计学Statistics的定义研究内容研究内容工作内容工作内容搜集搜集整理整理分析分析判断判断参与随机现象研究的设计观察和资料搜集处理研究参与随机现象研究的设计观察和资料搜集处理研究阶段与统计相关的问题并提出建议根据统计学原理阶段与统计相关的问题并提出建议根据统计学原理对资料进行统计分析和推断对资料进行统计分析和推断研究目的研究目的处理数据中的随机变异性,求得可靠的结果处理数据中的随
2、机变异性,求得可靠的结果4生物医学中的统计学分类医学统计学医学统计学Medical Statistics 生物统计学生物统计学Biostatistics 卫生统计学卫生统计学Health Statistics我国:统计学原理在医学中的运用我国:统计学原理在医学中的运用我国:生命科学实验研究我国:生命科学实验研究我国:预防医学研究我国:预防医学研究医学中的统计学科医学中的统计学科国际:生命科学研究、临床医学研究、预防医学研究国际:生命科学研究、临床医学研究、预防医学研究5医学中的统计医学统计医学统计医学中与统计相关问题及其解决方法医学中与统计相关问题及其解决方法收集、处理和分析医学中的随机现象收
3、集、处理和分析医学中的随机现象 统计学思维和方法帮助和解决统计学思维和方法帮助和解决医学研究和卫生决策中与统计相关的问题医学研究和卫生决策中与统计相关的问题 6医学中的统计发展史o 医学中的统计思维-百年发展n 1834 统计学的目标-数据搜集n 1894 Pearson 现代统计教育 Pearson和Galton的努力将其变为高级的应用数学学科,并用于解决医学、生物学问题n 1903 Lister预防医学研究所创建第一个统计系n 统计在医学中的作用开始得到强调和认可 强调医学艺术 统计艺术 强调个人经验 科学证据7医学中的统计问题o 医学领域的统计问题n 实验室研究-实验数据分析n 临床研究
4、-个体变异临床试验临床试验-临床治疗的有效性和安全性例如:临床用某种药物治疗缺铁性贫血的疗效甲:治疗10人,8人有效;乙:治疗10人,4人有效临床科研临床科研 外科医生观察了50例肿瘤病人的术后生存情况(月):3,10,20,12,28,7,98医学中的统计问题o医学领域的统计问题n 公共卫生-群体流行病研究流行病研究-吸烟与肺癌(Doll和Hill)卫生服务卫生服务-卫生资源需求和利用、医保改革健康统计健康统计-医学人口、生长发育、疾病统计等药学药物筛选、药代动力学等药物筛选、药代动力学等9基本概念个体与同质o 个体individual根据研究目的确定的最基本的研究对象单位,也称观察单位根据
5、研究目的确定的最基本的研究对象单位,也称观察单位 v同质同质(homogeneous)和异质和异质(heterogeneous)具有相同性质的观察单位称为同质的;否则为异质的具有相同性质的观察单位称为同质的;否则为异质的 调查某地1995年正常成年女子的糖化血红蛋白-同质的要素?调查某地1995年正常成年女子的雌激素水平-同质?10基本概念变量和资料o 变量variable所研究的观察对象的一个或几个特征,观察指标所研究的观察对象的一个或几个特征,观察指标 v资料资料data变量的观测值(亦称取值)组成变量的观测值(亦称取值)组成 v随机变量随机变量random variable观察结果是随机
6、的。随机变量分为:连续型和离散型变量观察结果是随机的。随机变量分为:连续型和离散型变量 11基本概念变量和资料o 变量类型n 连续型变量连续型变量-可能取值范围是一个区间,连续取值。即:在某一区间内的任意一个值都是可能被取到的。n 离散型变量离散型变量-取值范围是有限个值或一个数列构成 从变量的背景上考察:离散型变量取值的性质可以具有分类性质和不具有分类性质的。12基本概念变量和资料n 离散型变量离散型变量中取值表示分类情况的离散型变量又称为分类变量:o 无序变量:两分类两分类和无序多分类无序多分类,如血型。也可用数字进行编码,但背景上没有大小关系。o 有序多分类有序多分类变量/等级变量:在研
7、究背景下有等级顺序,如疗效(无效、有效、显效)o 变量的转化 连续型连续型-有序有序-分类(信息损失)如:年龄进行分分类(信息损失)如:年龄进行分组,疗效归为有效或无效等。组,疗效归为有效或无效等。13基本概念变量和资料小结14基本概念变量和资料例:调查某地某年1岁儿童的生长发育情况人群人群:某地某年1岁的儿童变量变量:性别、身高、体重、出牙、营养状况上述变量类型上述变量类型是什么是什么?15基本概念总体与样本例:假定某该地在1998年的7岁男孩有10万人,现研究1998年该地7岁男孩的身高情况。现在随机抽样调查了解现在随机抽样调查了解200200名名7 7岁男孩的身岁男孩的身高情况,测量他们
8、的身高,通过分析这高情况,测量他们的身高,通过分析这200200个儿童的身高推断该地个儿童的身高推断该地1010万个万个7 7岁男孩岁男孩身高情况。身高情况。16基本概念总体与样本 上述例子中涉及到下列概念:研究目的:1998年某地年某地7岁男孩的身高情况岁男孩的身高情况 研究对象:该地在:该地在1998年的年的10万个万个7岁男孩岁男孩 观察单位(个体):每个:每个7岁男孩岁男孩 观察指标:身高:身高(观察指标又称为变量观察指标又称为变量)观察值:身高测量值:身高测量值(亦称变量的取值亦称变量的取值)总体:该地:该地1998年的年的10万个万个7岁男孩身高观察值的全岁男孩身高观察值的全体。体
9、。即:即:10万个身高观察值构成的一个集合万个身高观察值构成的一个集合 样本:随机抽样的:随机抽样的200个个7岁男孩身高观察值岁男孩身高观察值17基本概念总体o 总体population 定义o 实际研究中往往观察/测量多个指标,构成个体的一组观察指标,因此简单的称总体是根据研究目的确定的同质个体的全体。o 有限总体(个体总数是有限的)和无限总体根据研究目的确定的同质的所有个体某项根据研究目的确定的同质的所有个体某项指指标标观察值观察值(测量值测量值)的集合的集合18基本概念总体与样本o 抽样:在较大范围的研究对象在较大范围的研究对象(总体总体/总体的一部分总体的一部分)中随机中随机抽取一部
10、分个体,收集这些对象的观察资料抽取一部分个体,收集这些对象的观察资料o 样本sample o 样本量sample size:样本中的个体总数样本中的个体总数n透过样本数据研究总体规律,通过对样本的分析了解总体的基本情况或推断总体的特征抽抽取这些取这些个体的个体的观察指标的观察指标的测量值构成样本测量值构成样本19基本概念概率和频率o 随机事件随机现象的某个可能观察结果。如治疗的结果:治愈和未愈随机现象的某个可能观察结果。如治疗的结果:治愈和未愈v频率频率frequency在在n次观察中,随机事件次观察中,随机事件A发生了发生了m次,则次,则A发生的比例为发生的比例为f=m/n频率呈现随机性和波
11、动性。eg.治愈率不同。随着观察次数n的增大,f随机波动幅度减小,并趋于常数即概率。20基本概念概率和频率v概率概率probability描述随机事件发生的可能性大小,取值范围为描述随机事件发生的可能性大小,取值范围为0-1小概率事件:随机事件发生的概率小于等于0.05小概率事件原理:小概率事件在一次随机抽样中不会发生 统计推断的原理统计推断的原理一般而言,概率是未知的总体参数21基本概念个体变异和资料分布o 同质总体的个体观察值是大同小异o 个体变异individual variationo 例:调查某地1999年20-40岁全部成年男子的血红蛋白水平o 同一总体的同质性,不同总体的异质性n
12、 研究同性别、同年龄中日小学生的身高是否相同-大同小异?总体不同?同质个体同质个体的同一指标测量值的同一指标测量值之间的之间的有一定有一定差异差异的的 22基本概念个体变异和资料分布 同类个体变异在概率意义下是有规律的,表现为观察值同类个体变异在概率意义下是有规律的,表现为观察值出现在不同范围中的概率大小出现在不同范围中的概率大小o 资料分布n同一总体的个体之间的差异具有一定的规律性,以变量值的分布来反映,如正态分布,称为某变量服从正态分布。n任何随机现象或随机变异都有其固有的分布规律,即概率分布,在大量重复观察的条件下就会呈现其规律性随机变异的规律性为该指标取值的概率分布,简称为资料的分布随
13、机变异的规律性为该指标取值的概率分布,简称为资料的分布23基本概念总体参数o 参数n 用来确定某一分布的特征;如总体均数,总体阳性率n 总体参数往往是未知的刻画总体特征的指标称为总体参数刻画总体特征的指标称为总体参数24基本概念参数和统计量o 统计量刻画样本特征的指标称为统计量刻画样本特征的指标称为统计量,即:由观察,即:由观察资料资料计算出来的样本指标;可以用来近似的计算出来的样本指标;可以用来近似的反映总体参数反映总体参数o 统计的任务:由样本了解总体,由样本统计量估计总体参数25基本概念抽样误差和测量误差o 抽样误差sampling error由随机抽样造成的样本统计量和总体参数之间的差
14、异由随机抽样造成的样本统计量和总体参数之间的差异抽样误差在一次抽样中是随机的,在概率意义下抽样误差在一次抽样中是随机的,在概率意义下(大量重复抽样中大量重复抽样中)是有规律的,这种规律称为抽样分布是有规律的,这种规律称为抽样分布o 抽样分布描述统计量估计总体参数的误差由于个体变异存在,抽样误差不可避免,但可通过增加样本含量减小26基本概念抽样误差和测量误差o 测量误差n可以通过改进措施消除或减少,是可控的。如同一时间观察实际观察值呈现规律性的偏离观察真实值实际观察值呈现规律性的偏离观察真实值27统计工作的步骤 设计:正确、周密的设计是研究成败的关键正确、周密的设计是研究成败的关键 收集:准确可
15、靠:准确可靠n来源:统计报表、工作记录、专题调查或实验 整理:原始资料的清理、录入、检查:原始资料的清理、录入、检查 分析n统计描述和统计推断,由样本估计总体,由样本统计量估计总体参数;n合理解释统计分析结果,阐明结果与研究背景的关系28目标与方法 目标:了解统计的重要性,学会统计的思维,了解统计的重要性,学会统计的思维,用统计的方法为自己的工作服务用统计的方法为自己的工作服务 方法:根据实际研究问题,应用统计理论知识,分析资料,得出合理的统计结论n 掌握基本知识、基本技能、概念的方法n 多联系实际n 讨论和操作29统计软件和教学要求o 本课程采用Stata软件进行统计实践o 要求每位同学能够
16、熟练掌握Stata软件的基本操作o 提供给每个同学一套题目和相应的数据(每人的数据是不同的),要求每个同学都要完成这套题目的数据分析,并且上交分析报告。o 每人要到医学电子期刊上找一篇论文。评价该论文中的统计问题和研究设计问题,交文献评阅报告。o 每个寝室派一个代表报告文献评阅,全班讨论,教师总结。30如何学习好卫生统计学o 上课适当地记一些关键的笔记o 统计课与医学课最大的不同是考理解而不是靠强记,不能靠集中记忆完成本课程学习。o 对于没有理解的问题,及时与同学和教师交流。o 课后及时完成习题以及相应的统计软件操作o 经常考虑一下,如果自己面临某种研究状况和数据,如何进行统计分析或研究设计。考试要求o 每个学生都有一套数据需要进行写数据分析报告o 每人翻译一篇文献的英文摘要(要求结构式摘要)o 每人找一篇文献进行评价,并且3个人一组,每组选择一个人进行进行汇报和大家一起讨论o 上述30%,书面考试(70%),不要求记统计公式,要求强化概念理解,根据设计,资料特定,正确选择统计分析方法和解释分析结果。3132