医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt

上传人(卖家):罗嗣辉 文档编号:2089158 上传时间:2022-02-14 格式:PPT 页数:48 大小:261.50KB
下载 相关 举报
医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt_第1页
第1页 / 共48页
医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt_第2页
第2页 / 共48页
医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt_第3页
第3页 / 共48页
医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt_第4页
第4页 / 共48页
医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

1、医学统计学医学统计学绪绪 论论Introduction 王友洁王友洁 email email 什么是统计学什么是统计学 Statistics:“a science dealing with the collection, analysis, interpretation and presentation of masses of numerical data” -Webster 国际大辞典国际大辞典 统计学统计学是是 收集、分析、解释收集、分析、解释与与呈现呈现数据数据资料的一门科学。资料的一门科学。为什么要学医学统计学?为什么要学医学统计学?一、统计学是研究随机现象的方法论一、统计学是研究随

2、机现象的方法论 采用统计学方法,发现不确定现象背后隐藏的规律。变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同二、统计学是医学研究设计的技术二、统计学是医学研究设计的技术 三大原则:对照、随机、重复三、统计学是医学研究资料分析的技术三、统计学是医学研究资料分析的技术 平均数、率、假设检验四、统计学是医学研究结果表达的有效语言四、统计学是医学研究结果表达的有效语言 统一规范、可比、科学五、统计学成为医学专业学生的应用技术五、统计学成为医学专业学生的应用技术 成为日常工作思维的一部分。 “阳性阳性”结果是否是虚假联系

3、?结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性阴性”结果是否是样本含量不足?结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。 结论结论-建立在研究证据上(调查的数据,实验室数据)建立在研究证据上(调查的数据,实验室数据)结果结果 =结论结论? 结果是来自研究的一些对象(样本),结果是来自研究的一些对象(样本), 而结论是是普遍性的(总体)而结论是是普遍性的(总体)六、保证你的研究论文能通过统计学审

4、查六、保证你的研究论文能通过统计学审查l 据国外6080年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。l 国内对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。lJAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。l国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求中也包含了统计学

5、要求为什么要学医学统计学?为什么要学医学统计学?主要内容主要内容l1. 统计学的定义与内容统计学的定义与内容l2. 卫生统计学资料分类卫生统计学资料分类l3. 卫生统计学中基本概念卫生统计学中基本概念l4. 卫生统计工作研究步骤卫生统计工作研究步骤lThe science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results.l (John M. Last, A Dictionar

6、y of Epidemiology) 统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析和表达数据,目的是求得可靠的结果。什么是统计学什么是统计学医学统计学医学统计学(health statistics) 是应用统计学的原理和方法,研究医学科研中有关数据的搜集、整是应用统计学的原理和方法,研究医学科研中有关数据的搜集、整理、分析的一门应用科学。理、分析的一门应用科学。 医学统计学(医学统计学(medical statistics) 应用于医学研究,侧重于医学的生物性应用于医学研究,侧重于医学的生物性l卫生统计学卫生统计学(Health Statistics) 应用于医学研究,侧重于医

7、学的社会性应用于医学研究,侧重于医学的社会性l统计学统计学是认识社会和自然现象在数量特征方面的重要工具是认识社会和自然现象在数量特征方面的重要工具l卫生统计学卫生统计学是认识人群的健康与疾病现象在数量特征方面的重是认识人群的健康与疾病现象在数量特征方面的重要工具,是进行医疗卫生、科学研究的重要手段要工具,是进行医疗卫生、科学研究的重要手段统计学的应用统计学的应用1. 计量资料计量资料2. 计数资料计数资料 3. 等级资料等级资料资料分类资料分类计量资料计量资料 用仪器、工具等测量用仪器、工具等测量(measure) 方法获得方法获得的数据,即为的数据,即为计量资料计量资料 (measurmen

8、t data)。也叫定量数据也叫定量数据Quantitative data特点:特点: 有计量单位有计量单位,如患者的身高(,如患者的身高(cm)、)、体重(体重(kg)、血压()、血压(mmHg)、脉搏(次)、脉搏(次/分)、分)、红细胞计数(红细胞计数(1012/L), 数据间有连续性。数据间有连续性。 计数资料计数资料 按某种属性分类,然后清点每类的数量,称按某种属性分类,然后清点每类的数量,称计计数资料数资料(count datacount data)或)或enumeration dataenumeration data。也叫。也叫定性数据定性数据(Qualitative data)(

9、Qualitative data)特点:特点:无固有计量单位无固有计量单位 肤色(黑、白)肤色(黑、白) 血型(血型(ABOABO) 职业(工农兵)职业(工农兵) 性别(男女)性别(男女)各观察单位间或者相同或存在质的差别各观察单位间或者相同或存在质的差别 有有质的差别者之间无连续性质的差别者之间无连续性等级资料等级资料 等级资料(等级资料(rank data)rank data)半定性或半定量的观察结半定性或半定量的观察结果。有大小顺序,所以也叫果。有大小顺序,所以也叫有序分类资料有序分类资料(ordinal ordinal category datacategory data。 例如:例如

10、: 癌症分期:早、中、晚。癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。 尿蛋白:尿蛋白: , , , +, +及以上。及以上。 特点:特点: 各观察单位间或相同,或存在质的差别; 各等级间只有顺序,而无数值大小。 l 数值变量资料数值变量资料l 分类资料分类资料 二分类二分类 多分类多分类无序多分类无序多分类有序多分类有序多分类(等级资料等级资料)资料的分类资料的分类l连续性资料连续性资料(continuous data) 资料的分类资料的分类Discrete data - Gaps between possible values- count

11、0 1 2 3 4 5 6 7Continuous data - Theoretically,no gaps between possible values- measure0 1000l离散型资料离散型资料(discrete data)实例数据实例数据1 1实例数据实例数据2 2资料类型的转化资料类型的转化 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血

12、压计量资料计量资料等级资料等级资料计数资料计数资料基本概念基本概念1.1.变量及其分类变量及其分类2.2.观察单位观察单位3.3.同质与变异同质与变异4.4.总体与样本总体与样本5.5.参数与统计量参数与统计量6.6.误差误差7.7.概率概率 (1)变量变量(variable) 变量变量,统计上习惯用大写拉丁字母表示 ,如X、Y 、Z、 。 变量值变量值习惯习惯用小写拉丁字母表示 ,如性别x11 (男) 、x2 1 (男)、x3 0 (女) 、。编号编号 (ID)性别性别 (X)体重体重 (kg)(Y)疗效疗效(Z)张张11660李李21781王王30572 定义:收集资料时,对每个观察单位的

13、某项特征进行测量和观察,这种被观察单位的特征称为变量。 变量的分类变量的分类 离散型变量离散型变量(discrete variable) 连续性变量连续性变量(continuous variable) 相当于计量资料相当于计量资料 有序变量有序变量(ordinal variable) 相当于等级资料相当于等级资料2. 变量(变量(variable):收集资料时,对每个收集资料时,对每个观察单位的某项特征进行测量和观察,观察单位的某项特征进行测量和观察,这种被观察单位的特征称为变量。变化这种被观察单位的特征称为变量。变化的或取值不同的量,一般指随机变量。的或取值不同的量,一般指随机变量。常用大写

14、英文字母表示,如常用大写英文字母表示,如X 、Y 等。等。研究目的研究内容确定转转化化临床上的生理、生化指标及体征表现等连续型变量(定量指标)非连续型变量(定性指标)(2)观察单位观察单位observation unit是获得数据的最基本的最小的单位。是获得数据的最基本的最小的单位。足月足月剖宫产剖宫产中学中学干部干部7 757.057.0154154292920257832025783足月足月助产助产中学中学无无3 370.570.5158158242420194642019464早产早产助产助产中学中学无无4 466.066.0158158202020258342025834早产早产顺产顺

15、产小学小学无无2 268.068.0157157272720245352024535足月足月剖宫产剖宫产中学中学商业商业111162.062.0159159252520224662022466足月足月剖宫产剖宫产中学中学无无5 569.069.0161161232320225432022543足月足月顺产顺产大学大学管理员管理员6 668.068.0158158252520258302025830足月足月助产助产小学小学无无5 574.074.0160160222220256532025653足月足月顺产顺产中学中学无无5 571.571.5165165272720256552025655妊娠

16、结局妊娠结局分娩方式分娩方式文化程度文化程度职业职业住院天数住院天数体重体重身高身高年龄年龄住院号住院号观察单位observations个体individuals变量variablesQuantitative data Quantitative data 计量资料计量资料Qualitative data Qualitative data 计数资料计数资料Units;elements足月足月剖宫产剖宫产中学中学干部干部7 757.057.0154154292920257832025783足月足月助产助产中学中学无无3 370.570.5158158242420194642019464早产早产助产

17、助产中学中学无无4 466.066.0158158202020258342025834早产早产顺产顺产小学小学无无2 268.068.0157157272720245352024535足月足月剖宫产剖宫产中学中学商业商业111162.062.0159159252520224662022466足月足月剖宫产剖宫产中学中学无无5 569.069.0161161232320225432022543足月足月顺产顺产大学大学管理员管理员6 668.068.0158158252520258302025830足月足月助产助产小学小学无无5 574.074.0160160222220256532025653足

18、月足月顺产顺产中学中学无无5 571.571.5165165272720256552025655妊娠结局妊娠结局分娩方式分娩方式文化程度文化程度职业职业住院天数住院天数体重体重身高身高年龄年龄住院号住院号观察单位observations个体individuals变量variablesQuantitative data Quantitative data 计量资料计量资料Qualitative data Qualitative data 计数资料计数资料Units;elements (3)同质与变异同质同质(homogeneity):指事物的性质、影响条件:指事物的性质、影响条件或背景相同或非常

19、相近。或背景相同或非常相近。l同质性是构成研究总体的必备条件;同质性是构成研究总体的必备条件;l研究内容不同,对同质性的要求不同;研究内容不同,对同质性的要求不同;变异变异(variation):指同质的个体之间的某个变量:指同质的个体之间的某个变量的差异。的差异。 Example: 同质与变异l例例1 调查调查2013年武汉市市年武汉市市7岁男童的身高岁男童的身高和体重和体重同质同质:2013年、武汉市、年、武汉市、7岁男童岁男童变异变异:身高和体重各不相同:身高和体重各不相同l例例2 研究某降压药的疗效研究某降压药的疗效同质同质:高血压患者、用某药治疗:高血压患者、用某药治疗变异变异:疗效

20、各不相同:疗效各不相同(4)总体与样本 总体总体(populationpopulation) :根据研:根据研究目的确定的究目的确定的同质同质研究对象研究对象的的全体全体(集合)。(集合)。样本样本(samplesample) :从总体中随机:从总体中随机抽取的部分观察单位抽取的部分观察单位 总体有三大特点:总体有三大特点:l同质性同质性l大量性大量性l差异性差异性总体可分为两大类:总体可分为两大类:l有限总体:指总体单位数有限而可以计数的总体有限总体:指总体单位数有限而可以计数的总体l无限总体:指总体单位数无限不可以计数的总体无限总体:指总体单位数无限不可以计数的总体 随机抽样 random

21、 sampling 为了保证样本的为了保证样本的可可靠性靠性和和代表性代表性,需要采,需要采用随机的抽样方法(在用随机的抽样方法(在总体中每个个体具有总体中每个个体具有相相同的机会同的机会被抽到)。被抽到)。l随机随机(random)l机会均等机会均等l随机抽样随机抽样(random sampling) 有相同的机会被抽到有相同的机会被抽到l随机分组随机分组(random allocation) 有相同的机会被分到不同的组中有相同的机会被分到不同的组中l实验顺序随机实验顺序随机 先后接受处理的机会相同先后接受处理的机会相同 (5)参数与统计量 parameter and statistic参数

22、参数:总体总体的统计指标,的统计指标,如总体均数、标准差,采如总体均数、标准差,采用希腊字母分别记为用希腊字母分别记为、。固定的常数固定的常数 样本样本抽取部分观察单位抽取部分观察单位 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为。丁字母分别记为。 参数附近波动的随机变量参数附近波动的随机变量 。SX、 描述总体性描述总体性 质特征的量质特征的量描述样本性描述样本性质特征的量质特征的量参数 统计量 (6)误差 error误差误差:实际:实际观察值观察值与客观与客观真实值真实值之差之差(1 1)系统误差

23、)系统误差(2 2)随机误差)随机误差 系统误差 systematic error 在实际观测过程中,由受试对象、研究者、仪在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为有一定倾向性或规律性的误差。流行病学称之为偏偏倚倚(biasbias)。)。 特点:观察值有特点:观察值有系统性系统性、方向性方向性、周期性周期性的的偏离真值。偏离真值。 可以通过严格的可以通过严格的实验设计实验设计和和技术措施技术措施消除消除。随机误差random error 排除上述误差后尚存的误差,

24、受多种无法控制的因素排除上述误差后尚存的误差,受多种无法控制的因素的影响。的影响。 特点:大小方向不一的随机变化。特点:大小方向不一的随机变化。随机测量误差随机测量误差(random measurement errorrandom measurement error) 提高操作者熟练程度可以减少这种误差提高操作者熟练程度可以减少这种误差 随机抽样误差随机抽样误差( randomrandom sampling error)sampling error) 由抽样造成的样本统计量和总体参数间的差异。由抽样造成的样本统计量和总体参数间的差异。 不可避免,但有一定的分布规律,可估计。不可避免,但有一定的

25、分布规律,可估计。(7)概率 probability 确定性现象确定性现象:在一定条件下,:在一定条件下,一定一定会发生或一定不会会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果发生的现象。其表现结果为两种事件:肯定发生某种结果的叫的叫必然事件必然事件;肯定不发生某种结果的叫;肯定不发生某种结果的叫不可能事件不可能事件。 随机现象随机现象:在同样条件下:在同样条件下可能可能会出现两种或多种结果,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为究竟会发生哪种结果,事先不能确定。其表现结果称为随随机事件机事件。随机事件的特征:。随机事件的特征:随机性随机性;

26、规律性规律性:每次发:每次发生的可能性的大小是确定的。生的可能性的大小是确定的。 概率:概率:随机事件发生的可能性大小,用大写的随机事件发生的可能性大小,用大写的P P表示;取表示;取值值00,11。 必然事件必然事件 P P = 1 = 1 不可能事件不可能事件 P P =0 =0 随机事件随机事件 00P P11 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称称为为小概率事件小概率事件( (习惯习惯) ),统计学上认为不大可能,统计学上认为不大可能发生。发生。小概率事件 样本的实际发生率称为样本的实际发生率称为频率频率。设在相同。设在相同条件下,独立重复进

27、行条件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f 次,则事件次,则事件A A出现的频率为出现的频率为f f / / n n。 频率与概率间的关系:频率与概率间的关系: 样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 样本含量样本含量n n越大,波动幅度越小,频率越越大,波动幅度越小,频率越接近概率。接近概率。频率 frequency收集数据收集数据整理数据整理数据解释数据解释数据分析数据分析数据统计工作的基本步骤设计设计 design调查设计调查设计实验设计实验设计试验研究试验研究(动物、生物材料)(动物、生物材料)临床试验临床试验(人)(人)分类分类干预措施

28、干预措施研究对象研究对象人道主义人道主义论理学论理学收集资料收集资料(collection of data)l(1)资料来源:)资料来源:l统计报表统计报表l医疗卫生工作记录和报告卡医疗卫生工作记录和报告卡l专题调查或实验专题调查或实验l(2)对资料要求:完整、准确、及时)对资料要求:完整、准确、及时 对原始资料进行科学的加工与综合,使之系统化对原始资料进行科学的加工与综合,使之系统化 (1 1)检查与核对:)检查与核对: (2 2)分组设计:质量分组,数量分组)分组设计:质量分组,数量分组 (3 3)拟订整理表:)拟订整理表: (4 4)归纳汇总:)归纳汇总:整理资料整理资料(sorting

29、 data) 应用统计学方法计算分析资料,结合专业应用统计学方法计算分析资料,结合专业理论,探索规律。理论,探索规律。分析资料分析资料(analysis of data) 医学研究中的统计学问题60年代到年代到80年代,国外医学杂志调查结果:年代,国外医学杂志调查结果:有统计错误的论文有统计错误的论文20%72%。1996年对年对4586篇论文统计(中华医学会篇论文统计(中华医学会系列杂志占系列杂志占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。伪造统计数据违反科学道德 1976 1976年年New Science New Science 杂志关于科研舞弊行为的调查杂志关于科

30、研舞弊行为的调查(1 1)74%74%的调查表反映有不正当修改数据的情况的调查表反映有不正当修改数据的情况(2 2)17%17%拼凑实验结果拼凑实验结果(3 3)7%7%凭空捏造数据凭空捏造数据(4 4)2%2%故意曲解结果故意曲解结果lFancy statistical methods cannot rescue garbage datalFancy statistical methods can help you gain insight into your data, over and above what seems obvious on its facelYou should alw

31、ays worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.A Warning!统计思维(1)l生物体的变异是普遍存在的,这种变异是有生物体的变异是普遍存在的,这种变异是有规律的;规律的;l抽样误差是不可避免的,抽样误差是有规律抽样误差是不可避免的,抽样误差是有规律的;的;l统计推断是有风险的,这种风险是可以控制统计推断是有风险的,这种风险是可

32、以控制的。的。l统计学上得到的结论都具有概率性,它不能证明什么,但可以提供结论成立或不成立的概率,从而提高研究者的分辨能力,为科学决策提供依据。l统计学不能创造原本不存在的结论。l统计方法是一个中立性的工具。 统计思维(2)学习医学统计学的要求l建立统计学思维建立统计学思维l学会从不确定性、机遇、风险和推断的角度去思考医学学会从不确定性、机遇、风险和推断的角度去思考医学问题提高自身的科学素质和医学研究能力;问题提高自身的科学素质和医学研究能力;l学会设计学会设计l结合专业作出严密的试验设计并获得可靠、准确、完整结合专业作出严密的试验设计并获得可靠、准确、完整的资料;的资料;l学会分析与表达学会

33、分析与表达l学会运用统计方法充分挖掘资料中蕴含的信息,恰如其学会运用统计方法充分挖掘资料中蕴含的信息,恰如其分地进行理性概括,写出具有科学认证的研究报告和学术分地进行理性概括,写出具有科学认证的研究报告和学术论文。论文。l1. 某年级甲班、乙班各有男生某年级甲班、乙班各有男生50人。从两个人。从两个班各抽取班各抽取10人测量身高,如果甲班的平均身高人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?也大于乙班?为什么?l2用用A,B两种药物分别治疗一批患者。如果两种药物分别治疗一批患者。如果A药的治愈率高于药的治愈率高于B药,药,证明证明A药的疗效优于药的疗效优于B药。这种说法对吗?为什么?药。这种说法对吗?为什么?思考题

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(医学统计学课件:1-统计学绪论(12.17)(ACER-PC-acer-2014-05-02-00,33,04).ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|