1、医学科研中的统计学方法医学科研中的统计学方法 (Statistical Methods in Medical Sciences)授课对象:授课对象:硕士研究生硕士研究生 (理论理论-1班班 上机上机-3班班)授课教师:授课教师:宋曼殳宋曼殳 Email:Tel:83911497 (阶平楼230)授课时间:授课时间:2016.09.092016.11.18考试形式、教材及参考资料形 式:试卷(80%)+上机(20%)教材:孙振球、徐勇勇 主编.医学统计学(第4版)罗家洪、郭秀花 主编.医学统计学计算机 操作教程参考书:1.方积乾 主编.生物医学研究的统计方法 2.张文彤或宇传华 主编SPSS操作
2、教程 网络课程网址:网络课程网址:周次周次日期日期星期星期节次节次讲课内容讲课内容授课教师授课教师学学时时29月月9日日五五15绪论,统计表和统计图绪论,统计表和统计图宋曼殳宋曼殳549月月23日日五五15计量资料统计描述、参数估计、计量资料统计描述、参数估计、t检验检验宋曼殳宋曼殳559月月30日日五五15方差分析方差分析宋曼殳宋曼殳5710月月14日日五五15定性资料的统计描述与统计推断定性资料的统计描述与统计推断宋曼殳宋曼殳5810月月21日日五五15非参数检验、直线相关与回归非参数检验、直线相关与回归宋曼殳宋曼殳51011月月4日日五五15多重线性回归与多元逐步回归、多重线性回归与多元
3、逐步回归、logistic回归回归王友信王友信51111月月11日日五五14生存分析、生存分析、cox回归、总复习回归、总复习宋曼殳宋曼殳4教学进度教学进度 (理论课(理论课 )地点:一教楼地点:一教楼 108 108 教室教室 周次周次日期日期星期星期 节次节次讲课内容讲课内容授课教师授课教师学学时时备备注注910月月28日日五五15SPSS介绍及基本操作;网络课程介绍介绍及基本操作;网络课程介绍张凤、罗艳侠、宋曼殳张凤、罗艳侠、宋曼殳510自行安排自行安排五五110统计描述,统计描述,t检验;方差分析检验;方差分析卡方检验;秩和检验卡方检验;秩和检验罗艳侠罗艳侠10网网络络1211月月18
4、日日五五15相关回归;其他方法回归;综合实习相关回归;其他方法回归;综合实习张凤、罗艳侠、祝慧萍张凤、罗艳侠、祝慧萍5教学进度教学进度 (上机课(上机课 )地点:二教楼地点:二教楼 404404、405 405 教室教室 (张凤)(张凤)二教楼二教楼 410410、411 411 教室教室 (罗艳侠)(罗艳侠)二教楼二教楼 409 409 教室教室 (宋曼殳、祝慧萍)(宋曼殳、祝慧萍)考试时间(暂定):11月25日 或 12月2日第一章 绪论 第一节 概述 一、定义 1.1.统计学(统计学(Statistics)Statistics):是关于数据(是关于数据(datadata)的学问,是从数)
5、的学问,是从数据中提取信息、知识的一门科学与艺术,据中提取信息、知识的一门科学与艺术,包括研究设计、数据搜集、数据整理、数包括研究设计、数据搜集、数据整理、数据分析和结果报告等步骤。据分析和结果报告等步骤。现代统计学的新观念现代统计学的新观念统计学是对不确定性问题做决策的科统计学是对不确定性问题做决策的科学学。从哲学角度看,统计学是从个性中寻找共性,透过偶然现象看事物内部本质规律的一种方法和手段。“统计学既是一门科学也是一门哲学。统计学既是一门科学也是一门哲学。”统计学统计学理论基础理论基础研究对象研究对象概率论概率论数理统计数理统计有变异的有变异的事物事物 概率论和数理统计是一门随机数学分支
6、,它们是密切联系的同类学科。但是概率论、数理统计、统计方法又都各有它们自己所包含的不同内容。概率论是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性作出一种客观的科学判断,对这种出现的可能性大小做出数量上的描述;比较这些可能性的大小、研究它们之间的联系,从而形成一整套数学理论和方法。数理统计是应用概率的理论来研究大量随机现象的规律性;对通过科学安排的一定数量的实验所得到的统计方法给出严格的理论证明;并判定各种方法应用的条件以及方法、公式、结论的可靠程度和局限性。使我们能从一组样本来判定是否能以相当大的概率来保证某一判断是正确的,并可以控制发生错误的概率。统计方法是以上提供的方法在
7、各种具体问题中的应用,它不去注意这些方法的的理论根据、数学论证。进行统计进行统计设计,收设计,收集、整理集、整理资料资料 对所收集对所收集资料进行资料进行统计描述统计描述和处理和处理 对统计处对统计处理的结果理的结果进行分析进行分析和解释和解释 统计学的任务统计学的任务 基本任务和作用基本任务和作用基本任务基本任务1.结合专业知识和具体要求进行统计设计、搜集和整理资料;2、对所搜集的资料进行统计描述和处理;3、对统计处理的结果进行分析和解释;并做出科学的结论,以指导今后的实践。作用作用能帮助人们有计划、有目的进行调查研究和实验研究,合理的分析和解释实验数据,科学地揭示数据之间隐含的内在规律性。
8、2.2.医学统计学医学统计学 (Medical Statistics)(Medical Statistics)统计统计+医学医学交叉学科交叉学科 是研究是研究医学和生物学中医学和生物学中数据的设计、数据的设计、收集、整理与分析推断的一门学科。收集、整理与分析推断的一门学科。医学科研中的统计学方法医学科研中的统计学方法 医学数据收集、表达和分析方法。是以医学理论为指导,用统计学的原理和方法研究医学,侧重于临床医学中的数据的搜集、整理和分析。其主要内容为:医学统计学的基本原理和方法,及其在医学研究领域的应用。临床常用的统计方法:生存分析 多因素分析:多元回归与相关、logistic 回归、Cox比
9、例风险回归当研发了一种治疗高血压的新药,应该怎样评价该药的疗效?最基本的方法比较临床试验:将患者随机分为两组:一组服用该药,另一组服用对照药,观测并记录两者药物的疗效,最后统计分析该药物的有效性和安全性其中,统计学扮演什么角色?为何开设医学统计课?医学统计学的地位和作用为何开设医学统计课?医学统计学的地位和作用 在这个临床试验中有诸多问题需要回答:需要多少名患者参加试验?如何随机地将患者分为两组?哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效因素在两组的分布是一致的?如果两组疗效存在一定差别,怎样比较两种药物的疗效到底是否存在差别?换言之,我们需要了解这种差别是机会造成的,还是真
10、实存在的?统计学可以回答上述问题2.2.阅读医学科技书刊杂志和撰写论文阅读医学科技书刊杂志和撰写论文1.1.发现不确定现象背后隐藏的规律性发现不确定现象背后隐藏的规律性二、学习医学统计学的重要性 3.3.为开展科研工作打下基础为开展科研工作打下基础据调查,新英格兰医学杂志(据调查,新英格兰医学杂志(New England J.New England J.MedicalMedical)、美国医学杂志()、美国医学杂志(JAMA)JAMA)、英国医学杂志(、英国医学杂志(BritishBritishJ.MedicalJ.Medical)和)和LancettLancett等著名医学杂志发表的等著名医
11、学杂志发表的文章中,有文章中,有70%70%应用了统计学,而且杂志有统计学的常务应用了统计学,而且杂志有统计学的常务编审。编审。“统计学是现代医学大厦的一个重要支柱统计学是现代医学大厦的一个重要支柱”。-美国医学会杂志(美国医学会杂志(JAMAJAMA)主编)主编二、学习医学统计学的重要性国外研究项目中,统计的工作量和资金国外研究项目中,统计的工作量和资金的投入占总科研的比例为的投入占总科研的比例为20%20%至至30%30%。“统计学的地位不仅仅做统计学的地位不仅仅做配角配角,做装做装饰,而是顾问、参谋,甚至是决策者。饰,而是顾问、参谋,甚至是决策者。”-胡良平胡良平二、学习医学统计学的重要
12、性 3.3.为开展科研工作打下基础为开展科研工作打下基础医学工作者在从事科研工作时经常要进行统计咨询和统计分析工作。医学院校中,要求硕士和博士毕业论文的开题报告有统计方面的思考和统计学家参加,毕业论文答辩前要求请统计学家进行审阅。二、学习医学统计学的重要性科研工作中常见的统计学问题科研工作中常见的统计学问题Wang,et al.Medicine,2016Zhao,et al.OMICS,2014 老师,您好,我是老师,您好,我是2010级级*医院的研究生,学号医院的研究生,学号*,名叫,名叫*。我老师假期让。我老师假期让我做个随访,现在数据处理方面有些问题不是很有把握,想请教您一下。我做个随访
13、,现在数据处理方面有些问题不是很有把握,想请教您一下。这个随访是关于乳腺癌生存预后的研究,目的是研究一种血浆蛋白这个随访是关于乳腺癌生存预后的研究,目的是研究一种血浆蛋白sdf-1水平对水平对乳腺癌患者生存预后的影响和临床价值,现在要做乳腺癌患者生存预后的影响和临床价值,现在要做COX回归。有下面几个问题回归。有下面几个问题问您:问您:1、现在有一个变量乳腺癌的病理类型(导管内癌,浸润性导管癌,黏液腺癌,、现在有一个变量乳腺癌的病理类型(导管内癌,浸润性导管癌,黏液腺癌,乳腺肉瘤),临床上恶性度是有差别的,预后是不同的,那么我如何赋值比较乳腺肉瘤),临床上恶性度是有差别的,预后是不同的,那么我
14、如何赋值比较恰当,比如按恶性度分别赋值恰当,比如按恶性度分别赋值1、2、3、4是否可行,另外乳腺癌的受体状态是否可行,另外乳腺癌的受体状态ER、PR等阴性预后差,那么阳性、阴性如赋值等阴性预后差,那么阳性、阴性如赋值0、1,是否应该有一定方向,赋值的,是否应该有一定方向,赋值的大小方向是否应该与前面病理类型赋值大小方向一致,如果赋值方向不同是否大小方向是否应该与前面病理类型赋值大小方向一致,如果赋值方向不同是否会影响回归方程的结果。会影响回归方程的结果。2、还有一个问题,乳腺癌的肿瘤分期是由、还有一个问题,乳腺癌的肿瘤分期是由T(肿瘤)、(肿瘤)、N(淋巴结)、(淋巴结)、M(远处(远处转移)
15、三个变量决定的,那么我做转移)三个变量决定的,那么我做COX回归时,是把回归时,是把T、N、M以及分期四个变以及分期四个变量都引人方程还是只把肿瘤分期这个变量引人方程分析更恰当呢,国外相关文量都引人方程还是只把肿瘤分期这个变量引人方程分析更恰当呢,国外相关文献只引人了临床分期。献只引人了临床分期。3、有一个变量手术前病程,时间从几天到几年不等,大小相差悬殊,我做回归、有一个变量手术前病程,时间从几天到几年不等,大小相差悬殊,我做回归时是否应当进行转换,用哪种转换比较好,比如用时是否应当进行转换,用哪种转换比较好,比如用lg缩小数据间差异再做回归缩小数据间差异再做回归分析是否合理。分析是否合理。
16、PS.估计您年后这段时间也挺忙的,有时间就帮给看一下,谢谢您,祝您新年身估计您年后这段时间也挺忙的,有时间就帮给看一下,谢谢您,祝您新年身体健康,万事如意!体健康,万事如意!要有一定的数学基础要有一定的数学基础注重理解统计学的基本概念、基本原注重理解统计学的基本概念、基本原理、基本方法。搞清各种统计方法、理、基本方法。搞清各种统计方法、公式的公式的适用条件适用条件和和正确用法正确用法培养科学的统计思维方法培养科学的统计思维方法结合专业,联系实际,边学边用,在结合专业,联系实际,边学边用,在实践中学,强调应用实践中学,强调应用三、怎样学好医学统计学三、怎样学好医学统计学授之以鱼不如授之以渔授之以
17、鱼不如授之以渔要想帮助他人解决难题,还不如传授给他人解决难题的方法。三、怎样学好医学统计学临床流行病学和询证医学 微信号:bysyrcce三、怎样学好医学统计学三、怎样学好医学统计学三、怎样学好医学统计学三、怎样学好医学统计学一般步骤统计设计统计设计收集资料收集资料整理资料整理资料分析资料分析资料第二节 统计工作的步骤1、统计设计(design)统计设计统计设计是解决在科研中如何控制实验误差、改善实验有效性与正确分析实验结果的关键,它对专业设计布局的合理性与实验结论成立的可靠性起着重要保证作用。科研设计科研设计 专业设计专业设计调查设计 实验设计 统计设计统计设计主要涉及抽样方法、调查技术、质
18、量控制等 主要涉及实验设计类型、分组方法、样本含量估计等 原则:对照、重复、随机、盲法 临床试验设计 (药物等)统计研究设计统计研究设计 估计研究对象的数量(样本大小估计)跟据研究目的确定对照的类型 保证随机化和双盲原则的贯彻 跟据研究目的确定主要和次要考核指标 如何收集和汇总数据以保证数据质量 如何进行统计分析 原始记录原始记录 经常性资料经常性资料 专门报告卡专门报告卡 统计报表统计报表资料来源资料来源 现场调查现场调查 一时性资料一时性资料 实验室做实验实验室做实验 根据研究目的实验设计的要求收集准确的完整的充满信息的原始资料。2收集资料(Collection of data)3 3整理
19、资料整理资料(Sorting dataSorting data)就是将收集来)就是将收集来 的资料有目的,有计划地进行科学加工的资料有目的,有计划地进行科学加工(对原(对原始数据进行归纳整理,通常要做成一览表,如:始数据进行归纳整理,通常要做成一览表,如:频数表频数表)。目前数据管理一般采用统计软件,目前数据管理一般采用统计软件,如:如:pi Datapi Data、SPSSSPSS、SASSAS。4 4分析资料分析资料(Analysis of data)(Analysis of data)就是将经过就是将经过统计整理的结果,作一系列统计整理的结果,作一系列统计描述统计描述和和统计统计推断推断
20、,阐明事物的规律性。采用统计分析软,阐明事物的规律性。采用统计分析软件,如:件,如:SASSAS、SPSSSPSS、STATASTATA。统计分析统计分析统计描述统计描述统计推断统计推断假设检验假设检验参数估计参数估计点估计点估计区间估计区间估计4 4、分析资料、分析资料(Analysis of data)(Analysis of data)统计描述统计描述 按照设计要求,正确选择统计指标并进行计算;以最适的统计指标表达收集资料的数量特征集中性与离散性和/或变量变化规律。统计推断统计推断 在正确统计描述的基础上,根据样本提供的信息推断总体,对统计指标的差别和关联性在一定条件下(犯错误的概率很小
21、)进行统计分析和推论,为专业结论提供统计学依据 4 4、分析资料、分析资料(Analysis of data)(Analysis of data)总结与注意事项总结与注意事项结论可靠的关键结论可靠的关键调查或实验设计调查或实验设计 是否周密完善、是是否周密完善、是否按设计要求进行实施否按设计要求进行实施所选用指标是否具有特异性和客观性所选用指标是否具有特异性和客观性强、灵敏度和精确度高强、灵敏度和精确度高数据是否真实可靠、样本含量是否数据是否真实可靠、样本含量是否足够大足够大所选用的统计方法是否妥当;结果的所选用的统计方法是否妥当;结果的解释是否正确。解释是否正确。第三节资料类型(types
22、of data)统计资料的分类 医学统计资料 数值变量资料(定量变量资料)计量资料分类变量资料 无序分类变量资料(计数资料)二项分布资料 多项分布资料 有序分类变量资料(等级资料)1 1计量资料(计量资料(quantitative dataquantitative data):对每个观察单位用定量方法测定某项指标的数值对每个观察单位用定量方法测定某项指标的数值 大小所得的资料。大小所得的资料。特点:特点:有计量单位,如患者的身高(有计量单位,如患者的身高(cmcm)、体)、体重(重(kgkg)、血压()、血压(mmHgmmHg)、脉搏(次)、脉搏(次/分)、红细分)、红细胞计数(胞计数(101
23、0/L/L)资料类型有有数值变量数值变量(numerical variable)(numerical variable)与与分类变量分类变量(categorical variable)(categorical variable):2计数资料(Enumeration data)按性质或类别进行分组,然后再清点各组数目所得的资料。特点特点:无固有计量单位,:无固有计量单位,如肤色(黑、白),如肤色(黑、白),血型(血型(ABOABO),职业(工人、医生、教师),职业(工人、医生、教师等),性别(男女)等),性别(男女)3等级资料(Ranked data)将观察单位按某项指标的等级顺序分组,再清点各
24、组观察单位的个数所得的资料。特点特点:半定性或半定量的观察结果。:半定性或半定量的观察结果。有序多分类(有序多分类(ordinal category dataordinal category data)癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死药物疗效:治愈、好转、无效、死 亡。亡。尿蛋白:尿蛋白:,+,+,+,+及以上及以上 某妇产科医生为了调查住院天数、分娩方式、某妇产科医生为了调查住院天数、分娩方式、妊娠结局是否与年龄、身高、体重、职业、文化程妊娠结局是否与年龄、身高、体重、职业、文化程度有关,该研究者利用常规保存的病案首页数据,度有关,该研究者利用常规保
25、存的病案首页数据,在某医院搜集了在某医院搜集了2014201420152015年共计年共计14001400名妊娠分娩名妊娠分娩妇女的资料,按住院号排序后排在前面的妇女的资料,按住院号排序后排在前面的1010名妇女名妇女的有关数据见表的有关数据见表1-11-1。职业、文化程度、分娩方式、。职业、文化程度、分娩方式、妊娠结局等变量的分类见表妊娠结局等变量的分类见表1-21-2。表表1-1 10名妊娠分娩妇女的有关数据名妊娠分娩妇女的有关数据住院号住院号年龄年龄(y)(y)身高身高(cm)(cm)体重体重(kg)(kg)职业职业文化文化程度程度住院天数住院天数(d)(d)分娩分娩方式方式妊娠妊娠结局
26、结局252516216276.076.0其他其他中学中学 9 9顺产顺产其他其他323215315360.060.0其他其他小学小学 7 7剖宫产剖宫产足月足月282815815864.064.0其他其他中学中学1010顺产顺产足月足月292916216268.068.0工人工人大学大学 8 8剖宫产剖宫产足月足月272715815868.068.0农民农民小学小学 6 6顺产顺产其他其他393915815866.566.5工人工人中学中学 8 8剖宫产剖宫产其他其他232316216268.068.0其他其他小学小学1111剖宫产剖宫产其他其他202016216270.570.5管理管理人员
27、人员大学大学 4 4顺产顺产足月足月272716016071.571.5其他其他中学中学 3 3顺产顺产其他其他222216216270.070.0工人工人大学大学 7 7剖宫产剖宫产足月足月 表表1-2 分类变量的类别分类变量的类别变量类别职业工人、农民、管理人员、知识分子、商业服务、其他文化程度文盲、小学、中学、大学及以上分娩方式顺产、先兆早产、助产、剖宫产妊娠结局足月、其他资料的类型资料的类型数值变量计量资料分类变量二分类变量 计数资料 无序多分类变量 有序多分类变量等级资料 三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界
28、分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料第四节 基本概念一、一、同质与变异同质与变异 (homogeneityhomogeneity and and variationvariation)在科学研究中,除了直接关注的研究因素外,其在科学研究中,除了直接关注的研究因素外,其他非研究因素(如性别、年龄)也会影响研究结果,他非研究因素(如性别、年龄)也会影响研究结果,为了突出研究因素的作
29、用,需要使各比较组之间的非为了突出研究因素的作用,需要使各比较组之间的非研究因素尽可能相同,即研究因素尽可能相同,即同质同质 。即使非研究因素控制在相同条件下,个体的观即使非研究因素控制在相同条件下,个体的观察值之间也会有所不同(如双胞胎的性格、身高、察值之间也会有所不同(如双胞胎的性格、身高、体重等),这种在同质基础上个体之间的差异称为体重等),这种在同质基础上个体之间的差异称为变异变异。变异是统计学研究的基础,没有变异就无需。变异是统计学研究的基础,没有变异就无需统计学,统计学正是处理数据变异的科学。统计学,统计学正是处理数据变异的科学。例如例如:研究某新药治疗胃溃疡的效果,:研究某新药治
30、疗胃溃疡的效果,所有研究对象都必须是确诊为胃溃疡所有研究对象都必须是确诊为胃溃疡的病人且病情相似,在这种的病人且病情相似,在这种同质同质的基的基础上观察治疗效果,有的人治愈,有础上观察治疗效果,有的人治愈,有的人未愈,这种差异就是的人未愈,这种差异就是变异变异。二、二、总体与样本总体与样本 (population and sample):(population)(population):根据研究的目的所:根据研究的目的所划定范围内的同质的个体构成的全体。划定范围内的同质的个体构成的全体。(sample)(sample):总体中随机抽取的一总体中随机抽取的一部分。部分。样本要具有:样本要具有:代
31、表性代表性、随机性随机性和和可靠性可靠性。总体(总体(population):根据研究目的所确定的被研究事物(同质的个体所组成)的全体,即同质的所有观察单位某种变量值的集合。例如:例如:调查2015年某城市正常成年男性发铅含量。观察对象:某城市所有成年男性观察单位:每个人变量:发铅含量变量值:每个人测定的发铅值。总体总体:2015年某城市所有正常成年男性的发铅值。同质基础:同一年份、同一地区、同为正常成年男性。2、样本(样本(sample):是从总体中随机随机抽取一部分个体所组成的集合。特特 性性可靠性可靠性 是指样本中每一个观察单位是否确属于既定的同质的总体。代表性代表性 是指样本是否能充分
32、反映总体的真实情况。三.误差的种类(types of error)(1 1)随机误差()随机误差(random errorrandom error)随机误差是由不确定原因引起的,随机误差是由不确定原因引起的,不可避免和消除不可避免和消除。其偏离总体的方向不其偏离总体的方向不能确定。包括随机测量误差和抽样误差。能确定。包括随机测量误差和抽样误差。随机测量误差(random measurement error):没有固定的倾向,可使多次观测结果有大有小。抽样误差(sample error):由于抽样造成的样本指标与总体指标之间的差别。(2)系统误差(systematic error)是由于偏倚(b
33、ias)使研究结果按照一个方向偏离总体,产生的错误结果,可校正和消除可校正和消除。(3)过失误差(gross error)是由于科研设计错误,或实验者的主观片面、粗心大意引起的误差。必须避免和剔除!必须避免和剔除!如:不遵守随机化分组原则、主观选取研究对象、记录错误、技术路线不清、计算错误等。这种差错纯属责任事故,是完全不应该发生的。四、概率与频率四、概率与频率(probability and relative frequency)什么是概率什么是概率(probability)?概率是度量随机事件概率是度量随机事件A发生可能性大小的发生可能性大小的一个数量,记为一个数量,记为P(A)。)。(描
34、述(描述总体总体的特征)的特征)可以证明可以证明:若当试验次数若当试验次数n n充分大以后充分大以后,频率频率k/nk/n稳稳定地在某一确定值定地在某一确定值P P 的附近摆动。的附近摆动。可用事件可用事件A A的频率作为所求概率的近似值的频率作为所求概率的近似值:P P(A)(A)f f(A)=k/n.(A)=k/n.什么是什么是频率频率(若在若在n n次同样的随机试验次同样的随机试验,事件事件A A发生了发生了k k次次,则比值则比值k/n k/n 称为频率。称为频率。(描述(描述样本样本的特征)的特征)频率与概率的关系频率与概率的关系 抛掷硬币的试验结果抛掷硬币的试验结果 某试验者抛掷硬
35、币的试验某试验者抛掷硬币的试验 抛掷次数(n)出现正面次数(k)频率(k/n)5 4 0.80 10 3 0.30 20 7 0.35 50 26 0.52 100 52 0.52 历史上许多名家做过抛掷硬币的试历史上许多名家做过抛掷硬币的试验验,抛掷硬币试验结果如表抛掷硬币试验结果如表5 5 表表5 45 4人抛掷硬币试验结果人抛掷硬币试验结果 试验者试验者 抛掷次数抛掷次数(n)(n)出现正面次数出现正面次数(k)(k)频率频率(k/n)(k/n)De Morgan 2048 1061 0.5180 Buffon 4,040 2048 0.5069 Pearson 12,000 6019
36、0.5016 Pearson 24,000 12012 0.5005 频率与概率的关系频率与概率的关系1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动2.样本含量样本含量n越大,波动幅度越小,频率越越大,波动幅度越小,频率越 接近概率。接近概率。频率与概率间的关系频率与概率间的关系必然事件必然事件 P P=1=1随机事件随机事件 0 0 P P 1 1不可能事件不可能事件 P P=0=0 P P 0.05 0.05(5 5)或)或 P P 0.01 0.01(1 1)称为)称为小小概率事件概率事件(习惯习惯),统计学上认为不大可能发生。,统计学上认为不大可能发生。小概率事件小概率事
37、件1、参数参数(parameter)是根据总体分布的特征而计算的是根据总体分布的特征而计算的总体指标。一般用总体指标。一般用小写的希腊字母小写的希腊字母表示总体参数。如总表示总体参数。如总体均数(体均数()、总体标准差()、总体标准差()、总体率()、总体率()等。)等。2、统计量统计量(statistical variable):由总体中随机抽取样由总体中随机抽取样本而计算的相应指标本而计算的相应指标,一般用一般用拉丁字母拉丁字母代表代表。如样本均。如样本均数(数(x x)、样本标准差()、样本标准差(s s)、样本率()、样本率(p p)等。)等。五、参数与统计量过程过程学习要点1、医学统计学的定义和主要内容2、医学统计学的地位和作用3、统计学中的几个基本概念4、医学统计工作的基本步骤5、统计资料的类型6、学习医学统计学应注意的问题
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。