1、 中医药统计学 第一章 绪论引子:概率应用示例概率应用示例 v 随机50个人聚在一起,其中有两个人生日是同一天的概率在97%以上,几乎可以说50个人中一定有两个人是同一天的生日。神奇吧!计算如下:统计应用示例统计应用示例 v 李颖同学的中医基础理论与伤寒论成绩分别为87分与80分,李颖同学所在班的这两门课程的平均成绩分别为80分和65分,标准差分别为7分和10分。那么,在班里,李颖同学擅长中医基础理论还是伤寒论的学习?v标准正态分布下:v v李颖同学在班里中医基础理论成绩排在前16%,伤寒论成绩排在前7%,可见李颖同学比较擅长伤寒论的学习。耐人寻味吧!医药统计应用示例医药统计应用示例 v 小儿
2、麻痹症在没有研制出疫苗之前是一种瘫痪或死亡率很高的疾病。在疫苗人体试验的过程中,科学家随机抽取了400000名儿童并随机分成两组,试验组注射疫苗,对照组注射安慰剂。结果发现试验组和对照组分别有56、138名儿童患上该病。56与138的差别是由随机抽样造成的,还是由疫苗的免疫作用所致的?统计推断分析结论是二者的差别超出了随机性本身所能解释的范围,疫苗有效。从此以后,这种疫苗普遍接种,在许多国家根除了小儿麻痹症。这是统计学为医学研究提供有力支持的代表实例之一。v脊髓灰质炎病毒是引起脊髓灰质炎的病毒。该疾病传播广泛,是一种急性传染病。病毒常侵犯中枢神经系统,损害脊髓前角运动神经细胞,导致肢体松弛性麻
3、痹,多见于儿童,故又名小儿麻痹症。v 统计思维总有一天会像读与写一样成为一个有效率公民统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。的必备能力。(至理名言)v H.G.Wellsv v 赫伯特赫伯特乔治乔治威尔斯威尔斯(Herbert George Wells 1866-1946),英国著名小说家,尤以科幻小说创作闻名于世。,英国著名小说家,尤以科幻小说创作闻名于世。1895年出版年出版时间机器时间机器一举成名,随后又发表了一举成名,随后又发表了莫洛莫洛博士岛博士岛、隐身人隐身人、星际战争星际战争等多部科幻小说。等多部科幻小说。v 谨与同学们共享共勉!谨与同学们共享共勉!第一节第
4、一节 概述概述v中医药统计学的概念中医药统计学的概念 v统计学的发展简史统计学的发展简史 v统计学的研究对象统计学的研究对象 v中医药统计学的主要内容中医药统计学的主要内容 v统计学的特点和基本思想统计学的特点和基本思想 三类现象数学研究方法统计学统计学(statistics)v是研究随机现象数量规律性的应用数学,是从随机现象数据中提取信息、知识的一门科学与艺术,是一门方法性学科。它分为理论统计学和应用统计学两大类。理论统计学理论统计学(theoretical statistics)v即数理统计学(mathematical statistics),是以概率论为基础,从纯理论的角度,对统计方法加
5、以推导论证,中心的内容是统计推断问题,实质是以归纳方法研究随机现象的一般规律。应用统计学应用统计学(applied statistics)v是数理统计学的原理方法在不同学科领域的具体应用。v数理统计学在生物学中的应用形成了生物统计学(biostatistics);v在医学中的应用形成医学统计学(medical statistics)、卫生统计学(health statistics)和中医药统计学(statistics for traditional chinese medicine)等。中医药统计学中医药统计学(statistics for traditional chinese medici
6、ne)v是研究中医药领域中随机现象客观规律的一门方法性学科,它运用数理统计学的基本原理与方法,结合医药实际,阐述中医药领域研究设计、收集资料、整理资料、分析资料、结果报告与结论表达。它属于应用统计学,是医药科学研究的重要工具与手段。统计学的发展简史统计学的发展简史 v人类实践是统计学产生的源泉,人类认识是统计学发展的动力。远古时代,人类利用手指、石子、贝壳、小木棍以及绳索等工具进行的计数活动就蕴藏着统计萌芽,但是,人类由统计实践上升到统计学,却只有300多年的历史。v17世纪中叶至18世纪初期为古典统计学的发展时期。统计学一词源于state,统计学意指国家国情的叙述,其研究方法主要采用文字记述
7、和形式逻辑比较法,用于人口、国力等情况的统计和分析。v18世纪后叶至20世纪初期为近代统计学的发展时期。误差理论和大数法则得到了应用和发展,其研究方法主要是建立在大样本上的大量观察法,重视运用统计指标和统计图表对数字资料进行统计描述。v20世纪初期至今为现代统计学的发展时期。1908年,英国统计学家戈赛特(W.S.Gosset,1876-1937)在生物统计杂志“Biometrika”上以笔名student发表了t分布,开创了小样本的研究,从而使统计学由“描述统计”向“推断统计”发展,开创了现代统计学的新纪元。20世纪50年代,电子计算机技术的发展和应用,促进了统计方法的应用与发展。v当今,现
8、代统计学的发展有如下几个明显趋势:随着数学的发展,统计学依赖和吸收的数学方法越来越多;统计方法与计算机技术相结合,已渗透到了所有学科部门,以统计学为基础的边缘学科不断形成;统计与实质性学科(如社会、经济、生物、医学等)、统计软件、现代信息相结合,所发挥的功效日益增强;统计学的作用与功能已从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展,已成为具有方法论性质的综合性学科。统计学的研究对象统计学的研究对象v 统计学所研究的对象是具有变异的事物,其变异为同质基础上的变异。v同质(同质(homogeneity)指观察单位间被研究指标的影响因素相同。(可控因素)v变异(变异(variati
9、on)指在同质基础上各观察单位间某观察指标的差异。v统计学是处理变异数据的科学,没有变异就无需统计学。v医药事物(现象)大多数都是具有变异的事物(现象),概率论称具有变异的事物(现象)为随机事件。v中医药统计学可将医药随机事件通过一定数量的观察、对比、分析与推断,由偶然性(不确定性)现象的剖析,发现事物内在的必然性(确定性)规律。中医药统计学的主要内容中医药统计学的主要内容 v中医药统计学以研究统计设计和统计方法为主要内容。v研究统计设计:实验设计、临床试验设计以及调查设计等 v统计方法包括:统计描述、统计推断和关系分析等。统计学的特点和基本思想统计学的特点和基本思想 v统计学认识事物现象有如
10、下特点:数量性、群体性、具体性和概率性等。v统计学的基本思想可归纳为:变异、随机抽样研究和概率的思想。统计结论中没有“证明”,只有在一定概率水平上的推论。第二节第二节 统计学几个基本概念统计学几个基本概念v总体与样本总体与样本 v参数与统计量参数与统计量 v误差误差 v概率概率 总体与样本总体与样本 v总体(总体(population)是根据研究目的所确定的同质观察单位的全体。v有限总体 与无限总体 v样本(样本(sample)是从总体中随机抽取的具有代表性的个体的集合。v抽样研究抽样研究(sampling study)是从总体中抽取样本,通过对样本的定量或定性测量结果来推断总体。v抽样研究的
11、目的是用样本的特征正确可靠地推断总体的特征,所以样本必须对总体具有良好的代表性,抽样研究应注意如下几点:v样本含量足够大样本含量足够大 v遵循遵循随机抽样随机抽样原则原则 v样本的构成分布应基本上与总体构成分布保样本的构成分布应基本上与总体构成分布保持一致持一致 参数与统计量参数与统计量 v反映总体的统计指标称为参数(parameter),用希腊字母表示,如:v反映样本的统计指标称为统计量(statistics),用拉丁字母或英文字母表示,如:v对某一事物而言,总体参数是该事物本身固有的、不变的,而统计量则随着实验不同而不同,但统计量的分布是有规律的,如小样本均数服从t分布,大样本均数服从正态
12、分布等,这些规律是统计推断的理论基础。误差误差 v误差(误差(error)泛指观测值与真实值之差以及样本统计量与总体参数之差。主要分为非随机误差与随机误差,非随机误差包括系统误差和过失误差,随机误差包括随机测量误差和随机抽样误差。v系统误差(系统误差(systematic error)是指在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。如仪器初始状态未调整到零、标准试剂未经校正所致误差。其特点为:观察值有系统性、方向性、周期性的偏离真值。这类错误可以通过严格的实验设计和技术措施消除。v过失误差(过失误差(gross error)由
13、于观察过程中不仔细造成的错误判断或记录。应认真检查核对,否则将会影响研究结果的准确性。v随机测量误差(随机测量误差(random measurement error)是指各种偶然因素(如电压、环境温度等)的影响造成对同一对象多次测定的结果不完全一样,或同一样品不同观察者之间的差异。该误差不可避免,但要控制在容许范围内。提高操作者熟练程度可以减少这种误差。v随机抽样误差(随机抽样误差(random sampling error)简称抽样误差(sampling error),是由于随机抽样所引起的样本统计量与总体参数间的差异以及各样本统计量之间的差异。医学现象的变异总是客观存在的,因而在抽样研究中
14、,抽样误差总是不可避免的,它虽无方向性,但有一定的分布规律,是可估计、可控制的,其大小可通过计算标准误间接地反映出来。样本对总体的代表性越好,抽样误差越小,反之,抽样误差越大。抽样误差揭示样本距总体的实际值可能有多远。准确度、精确度、效度、信度概率概率 v频率(频率(frequency)概率(probability)v在在概率论概率论上称频率收敛于概率。上称频率收敛于概率。v概率概率是反映随机事件发生的可能性大小的度量,用P表示,取值范围为0,1。v随机事件的概率为0-1;必然事件的概率等于1;不可能事件的概率等于0。v统计学通常把等于小于0.05或0.01的随机事件称为小概率事件小概率事件。
15、(人为规定)v一般认为小概率事件在一次试验中是不大可能发生的,这就是小概率原理小概率原理,它是统计推断的重要原理。第三节第三节 资料类型资料类型v数值资料数值资料v分类资料分类资料v相互转换相互转换v资料(资料(data)又称数据,由变量及其变量值组成。资料类型与变量类型相对应。v变量(变量(variable)是指观察单位的某种特征或属性,即研究的项目或指标。变量的测定结果称为变量值(value of variable)或观察值(observed value)。v数值资料(数值资料(numerical data)又称定量资料(quantitative data)或计量资料(measuremen
16、t data),是由仪器、工具或其它定量方法测定的某项指标量的大小所得到的资料。例如:测量100名男大学生的身高所获得的资料就是数值资料。v分类资料(分类资料(categorical data)又称定性资料(qualitative data)或计数资料(count data),是将事物按不同的属性归类,清点每一类的数量多少所得到的资料。根据类别数的不同,计数资料分为二分类资料(binary data)、无序多分类资料(unordered categorical data)和有序多分类资料(ordered categorical data),后者也称等级资料。v例如将100名大学生按性别分组:男
17、53例,女47例,此资料就是二分类资料;按ABO血型分组:A型39例、B型20例、O型17例、AB型24例,此资料就是无序多分类资料。v等级资料等级资料(ordinal data)又称半定量资料(semi-quantitative data)或有序多分类资料(ordered categorical data),是将事物属性按组别之间有程度或等级差别进行归类所得到的资料。例如用某中药治疗某种疾病患者50名,按临床疗效等级分为痊愈26例、显效12例、好转7例、无效5例,此资料就为等级资料或有序多分类资料。v根据分析的需要,各种资料可进行相互转化。可将数值资料转化为分类资料或等级资料,反过来,分类资
18、料和等级资料可通过数字编码或赋值,即数值化方式,转化为数值资料。v需要注意的是:数值资料变为分类资料或等级资料时信息量将减少,因此在收集数据阶段应尽量收集数值数据,并用原始数值资料建立数据集。v连续型随机变量是指在某一区间可取任何值的变量,如身高(cm)、体重(kg)、血压(KPa)等;v离散型随机变量是指在某一区间只可取有限的几个值的变量:如家庭人口数、脉搏(次/分)等。v数值资料对应的数值变量可以是连续型随机变量,也可以是离散型随机变量;分类资料和等级资料对应的分类变量和等级变量只能是离散型随机变量。v无序多分类变量又称名义变量(nominal variable),意指各种被命好的分类,在
19、各种分类中没有隐含的顺序,这与等级变量不同。v但是,等级变量中各分类之间的差异不能被认为是相等的。第四节第四节 基本步骤基本步骤v研究设计v收集资料v整理资料v分析资料v结果报告与结论表达第四节第四节 基本步骤基本步骤 v医药研究中的统计工作步骤包括:v研究设计、收集资料、整理资料、分析资料、结果报告与结论表达等。v这几个步骤是密切联系不可分割的,任何一个环节发生缺陷都会影响研究结果的质量和认证。研究设计研究设计 v研究设计(研究设计(research design)就是拟订一份合理的实验计划,将有关的研究方法与步骤的纲目拟订出来,用以保证取得一个较为客观的研究结果。根据对研究对象是否施加干预
20、措施,可将研究分为观察研究和实验研究两大类。v专业设计专业设计(specialized design)是指用什么方式、方法验证假说或回答有关专业问题。目的在于保证成果的实用性、可行性和创新性。做好专业设计一般需要具有过硬的专业知识、较强的查阅文献能力和善于多学科交流与合作的能力。v统计设计统计设计(statistical design)是指如何合理地安排实验内容,选择实验对象,计算样本含量,对实验结果进行有效的分析。目的在于保证结果的经济性、重复性、可靠性和科学性。实验统计设计,应遵循随机、对照、重复和均衡四个基本原则。临床试验研究还要遵从盲法的原则。v研究者一定要树立“设计优先”的思想,只有
21、缜密完善的研究设计,才能获得真实可靠的研究结果。中医药统计学用于医药科学研究,应从研究设计阶段开始,而不是在需要数据处理时。实验完成后再找统计学家无异于请统计学家为实验进行“尸体解剖”,统计学家或许只能告诉你失败的原因。收集资料收集资料 v收集资料收集资料(data collection)是指根据研究目的,按照设计要求去准确、及时和完整地收集原始资料。医药研究资料来源大致有:日常医疗工作记录和报告卡,统计报表,专题调查与实验或试验研究资料,公共或共享的其它资料。v收集资料的过程实际上是具体调查或实验实施的过程,要有科学的态度,实事求是的精神,如实收集资料,并应用通用或共享的数据库软件(如Exc
22、el,Access,SQL,Epidata等)将收集到的资料及时建立电子数据库。整理资料整理资料 v整理资料整理资料(sorting data)是把收集到的原始资料,有目的、有计划地进行科学的加工(如分组或汇总),使其系统化、条理化,以便更好地揭示所研究事物的规律性,有利于统计分析。整理资料包括资料核查和设计分组与汇总等。首先检查原始记录,及时纠错补漏;其次是标记可疑值,必要时对可疑值重新观测。根据资料的性质或数量特征,对资料进行分组,需要时按不同组段对原始资料进行归纳计数。分析资料分析资料 v分析资料(分析资料(analysis data)就是对资料进行统计分析。主要包括统计描述(stati
23、stical description)与统计推断(statistical inference)。v统计描述是指用适合资料性质的统计指标、统计图表等,对资料的数量特征及其分布规律进行表达,以反映变量值的水平、频率、联系强度。v统计推断是通过抽样研究,根据样本资料所提供的信息,对未知总体做出具有一定概率性的估计和推断,它包括参数估计和假设检验两方面。结果报告与结论表达结果报告与结论表达 v信息时代,医药科研设计、资料数据库的建立与管理、统计分析的大多数任务可以交给计算机完成,正确领悟统计思想以及统计软件所输出的结果,并在研究报告和论文中作出适当的解释与表达显得越来越重要。v统计学既是一门科学又是一
24、门艺术,其艺术性是通过表达来体现的。医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成,而每一部分或多或少都涉及统计表达,需要明确指出所使用的统计设计与分析方法,观察对象的纳入与剔除标准,是否随机抽样与随机分组,使用的何种统计软件及其版本,样本统计量、总体参数可信区间,检验统计量、值,并结合各学科专业知识对统计分析结果作出合理的解释,进而得出可信赖的专业结论。另外,可借助统计图表直观、形象表达统计结果。统计结果的规范化报告和结论的正确表达,能提高研究的认证度,也便于各层次的学术交流与研究。第五节第五节 作用与学习方法作用与学习方法v中医药统计学的作用中医药统计学的作用v学习方法
25、学习方法中医药统计学的作用中医药统计学的作用v医学统计学是医学科学研究的重要工具与手段,为医学科学研究提供统计思维、统计设计和统计分析方法。其思维和方法已渗透到医药研究和管理决策的方方面面。v中医学基础研究:气、血、营、卫的研究,经络的研究指标的选择与比较,证指标的客观化。v临床方面:临床经验的总结,药物的配伍和最佳剂量等用药规律的探索,各种致病因素对某疾病的影响程度比较分析。v新药的开发研制:动物实验、有效成分确定、质量标准制定、工艺筛选等。我国药品注册管理办法规定,新药临床试验必须自始至终有统计学人员参与,生物医药实验室研究、临床研究、流行病学探索和医药公共事业管理均需统计学的支持。v在医
26、药杂志上发表科研论文涉及数据分析都需要统计学处理。医药领域的抽样研究数据不经过统计学分析处理而得出的结论是不科学的,是不可信的。v医学统计学的全部功能仅在于帮助我们认识医学研究客观上存在的规律而不能“创造”规律。重视原始资料的完整性和准确性,对数据处理持严肃、认真、实事求是的科学态度,反对伪造和篡改统计数据,要防止利用统计软件进行资料分析“垃圾进,垃圾出”的现象发生。学习方法学习方法 v医学生学习中医药统计学的目的并非要使自己成为统计专业人员,而是使自己树立统计思想,学会统计思维,从不确定性和概率的角度去考虑问题,能结合医学问题合理设计,认真观察,准确收集资料,有效整理资料,正确运用统计方法分
27、析资料,恰如其分解释统计结果,得出可信赖的结论,写出具有一定学术水平的研究报告或科学论文,从而提高自身科学素养和研究能力。v在学习中医药统计学的过程中,医学生要重视对统计基本概念、基本原理、基本方法的理解,对统计公式主要了解其意义、用途和应用条件,不必深究其数学推导,也不需要死记硬背。v统计工作贯穿医学研究的全过程,要本着“设计优先”的原则,弄清资料来自何种统计设计,资料的属性是什么,是否满足参数检验的条件,用何种统计方法分析比较适宜等。要理论联系实际,重视理论学习与上机练习的有机统一。v总之:思想重视、观念正确、方法得当,两个坚持(认真听课、及时上机实验练习。),学以致用就能学好本课程。小结
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。