1、2023-1-121 医学统计学授课人:卢曲琴授课人:卢曲琴Email:2023-1-122医学统计学授课计划医学统计学授课计划 第第1章章绪论绪论 第第2章章SPSS概论概论 第第3章章计量资料的统计描述计量资料的统计描述 第第4章章计量资料的统计推断计量资料的统计推断 第第5章章计数资料的统计描述计数资料的统计描述 第第6章章计数资料的统计推断计数资料的统计推断 第第7章章非参数检验非参数检验 第第8章章直线相关与回归直线相关与回归 第第9章章描述统计表与统计图描述统计表与统计图 总课时总课时 32课时课时理论课理论课:16课时课时实验课实验课:16课时课时成绩成绩平时平时:20%考试考试
2、:80%2023-1-123统计工作的基本步骤35统计资料的分类34医学统计学的定义31医学统计学的研究内容及作用32统计中的几个基本概念33统计工作的基本步骤35统计资料的分类34医学统计学的定义31医学统计学的研究内容及作用32统计中的几个基本概念33第一章第一章 绪绪 论论2023-1-1242 0 0 2 年年 日本首創高度檢測功能的手腕式日本首創高度檢測功能的手腕式血壓計(血壓計(HEM-637IT)如今医生使用的血压计是希皮奥内如今医生使用的血压计是希皮奥内里瓦里瓦-罗奇罗奇(意大利科学家意大利科学家)在)在1896年发明的。年发明的。2023-1-125设计以下关键问题:设计以下
3、关键问题:(1)应检查多少台仪器?)应检查多少台仪器?(2)在每个仪器上应检查多少人?)在每个仪器上应检查多少人?(3)自动一起与人工仪器测量的顺序问题?)自动一起与人工仪器测量的顺序问题?(4)在问卷中应收集什么样的数据?)在问卷中应收集什么样的数据?(5)数据应如何记录以便为今后的电脑计算提供方便?)数据应如何记录以便为今后的电脑计算提供方便?(6)应如何检查已进入电脑中数据的准确性?)应如何检查已进入电脑中数据的准确性?(7)应用什么指标去考察研究结果?应用什么指标去考察研究结果?2023-1-126受试者位置受试者位置受试人数受试人数自动仪器自动仪器人工仪器人工仪器差差 值值A9814
4、2.5142.011.2B84134.1133.612.1C98147.9133.911.7D62135.4128.513.6两种方法测量的平均舒张压及两种方法的差值两种方法测量的平均舒张压及两种方法的差值C与与D的差异是不是某种意义上的的差异是不是某种意义上的“客观存在客观存在”的差异?的差异?问题的设计与回答依赖于医学统计学!问题的设计与回答依赖于医学统计学!l 统计学统计学(statistics)是关于数据(是关于数据(data)的科学,是从)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。分析和表达等步骤。l
5、“A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”(Websters International Dictionary)。(一)统计学的定义(一)统计学的定义 根据研究领域和研究对象,统计学又分为:数理根据研究领域和研究对象,统计学又分为:数理 统计、经济统计、生物统计、统计、经济统计、生物统计、医学统计医学统计、卫生统计、卫生统计 医学统计学医学统计学(Medical Statistics):用统计学的原理用统计学的原理 和和方
6、法研究方法研究生物医学生物医学中的问题的学科中的问题的学科。卫生统计学(卫生统计学(Health Statistics)生物统计学生物统计学(Biostatistics)(二)(二)什么是医学统计学?什么是医学统计学?2023-1-129统计工作的基本步骤统计工作的基本步骤3 35 5统计资料的分类统计资料的分类3 34 4医学统计学的定义医学统计学的定义3 31 1医学统计学的研究内容及作用医学统计学的研究内容及作用3 32 2统计中的几个基本概念统计中的几个基本概念3 33 32023-1-1210(一)(一)医学统计学的基本内容医学统计学的基本内容基本内容基本内容统计研究设计统计研究设计
7、基本统计方法基本统计方法临床常用统计方法临床常用统计方法医学多因素分析医学多因素分析其他方面的应用其他方面的应用统计描述统计描述统计推断统计推断队列分析队列分析病例对照病例对照综合评价综合评价临床试验临床试验1.采用统计学方法,发现不确定现象背后隐藏的规律采用统计学方法,发现不确定现象背后隐藏的规律 相同父母所生的子女为什么身高、体重各不相同?相同父母所生的子女为什么身高、体重各不相同?同一个教室的学生的学习成绩为什么各有千秋?同一个教室的学生的学习成绩为什么各有千秋?采用同样的药物治疗某病患者疗效为什么会有差异?采用同样的药物治疗某病患者疗效为什么会有差异?变异变异(variation)是社
8、会和生物医学中的普遍现象。)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有变异使得实验或观察的结果具有不确定性。不确定性。(二)学统计学的重要性(二)学统计学的重要性2023-1-12122.用统计学思维方式考虑有关医学研究中的问题用统计学思维方式考虑有关医学研究中的问题 某文献报道:某文献报道:用某种中草药治疗玫瑰糠疹,有效率为用某种中草药治疗玫瑰糠疹,有效率为78%,平均疗程为,平均疗程为3周左右。问此药治疗玫瑰糠疹的确周左右。问此药治疗玫瑰糠疹的确有效吗?有效吗?要求设立具有可比性的对照组要求设立具有可比性的对照组3.保证你的研究论文能通过统计学审查保证你的研究论文能通过统计
9、学审查统计知识统计知识的运用的运用撰写论文:报告自己观撰写论文:报告自己观察或实验的研究结果。察或实验的研究结果。阅读论文:吸收新知识,阅读论文:吸收新知识,了解学术进展。了解学术进展。研究者研究者1996年对年对4586篇论文统计(中华医学会系列杂篇论文统计(中华医学会系列杂志仅占志仅占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。“良好愿望的医学良好愿望的医学”(well-meaning medicine)转入)转入“以以证据为基础的医学证据为基础的医学”(evidence-based medicine,EBM)需)需要有统计学方法的支持。要有统计学方法的支持。全世界的医
10、学期刊每年大约刊登全世界的医学期刊每年大约刊登600万学术论文,但能作为万学术论文,但能作为可靠可靠“证据证据”的论文并不多。的论文并不多。“非常痛心地看到,因为数据分析的缺陷和错误,那么多非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险好的生物研究工作面临着被葬送的危险”。-F.Yates,M.J.R.Healy 4.获得循证医学证据的主要手段获得循证医学证据的主要手段2023-1-1215(三)医学统计思维进化和(三)医学统计思维进化和历史成就历史成就 一些重要的临床试验一些重要的临床试验 英国临床医学研究理事会(英国临床医学研究理事会(1946年):年)
11、:链霉素治疗肺结核的临床链霉素治疗肺结核的临床试验试验2023-1-1216链霉素治疗肺结核疗效的临床试验链霉素治疗肺结核疗效的临床试验 从从1530岁肺双侧进行性肺结核患者(总体)中抽取岁肺双侧进行性肺结核患者(总体)中抽取107例例患者(样本),随机分为两组,患者(样本),随机分为两组,试验组试验组55例例接受接受链霉素加链霉素加卧床休息卧床休息的治疗,的治疗,对照组对照组52例例用常规治疗(用常规治疗(单纯卧床休单纯卧床休息息)。)。6个月后,患者的个月后,患者的X-光片分别由两位放射学家和一位光片分别由两位放射学家和一位临床学家独立评价,结果见下:临床学家独立评价,结果见下:试验组生存
12、率为试验组生存率为93%(51/55)对照组生存率为对照组生存率为73%(37/51)P0.05结果试验组的存活率和放射学改善均优于对照组。结果试验组的存活率和放射学改善均优于对照组。2023-1-1217 美国(美国(1954年):年):评价索尔克(评价索尔克(Salk)疫苗预防)疫苗预防小儿麻痹或死于脊髓灰质炎的效果小儿麻痹或死于脊髓灰质炎的效果(干预试验、现(干预试验、现场试验;样本:场试验;样本:180万儿童;花费:万儿童;花费:500多万美元。多万美元。随机化随机化分组,最后约有分组,最后约有1/4参与者得到了随机化。这参与者得到了随机化。这项试验最终肯定了索尔克疫苗的效果)项试验最
13、终肯定了索尔克疫苗的效果)2023-1-1218 德国(德国(1960年代初),药物酞胺哌啶酮年代初),药物酞胺哌啶酮(Thalidomide,又称反应停)事件(又称反应停)事件(曾引起一次胎儿畸形(四肢体短缺)曾引起一次胎儿畸形(四肢体短缺)的暴发,经过病例对照研究和干预研究发现危险因素是的暴发,经过病例对照研究和干预研究发现危险因素是反应停)。反应停)。美国从这一事件促使有关法律文件的产生,美国从这一事件促使有关法律文件的产生,FDA为临为临床试验规定了一整套制度,使之成为确定床试验规定了一整套制度,使之成为确定药物疗效验药物疗效验的的标准方法。标准方法。t 历史成就历史成就:John G
14、raunt、William Farr(寿命寿命表表);John Snow(霍乱发生原因霍乱发生原因);Doll 和Hill(吸烟与肺癌吸烟与肺癌)2023-1-1219我国在医学统计学领域中的贡献我国在医学统计学领域中的贡献 1061年的在年的在本草纲目本草纲目第一次提到对照试验第一次提到对照试验:“为评价人参的效果为评价人参的效果,需寻两人需寻两人,令其中一人服食人令其中一人服食人参并奔跑参并奔跑,另一人未服人参也令其奔跑另一人未服人参也令其奔跑.未服人参者未服人参者很快就气喘吁吁很快就气喘吁吁.”1948年年,郭祖超教授编著的郭祖超教授编著的医学与生物统计方医学与生物统计方法法,是我国第一
15、部医学统计方法的教科书是我国第一部医学统计方法的教科书.(四)(四)工作生活中常见的统计学问题工作生活中常见的统计学问题l体育彩票能否中(体育彩票能否中(大大)奖?()奖?(概率的大小概率的大小)l政治人物的支持度,民意测验政治人物的支持度,民意测验(抽样调查抽样调查)l一月份的一月份的CPI(7.1)()(相对数相对数)l不同民族智商测量、税收标准(不同民族智商测量、税收标准(均数均数)l中国的轿车生产是否与中国的轿车生产是否与GDP、城镇居民人均可支配收、城镇居民人均可支配收入、城镇居民家庭恩格尔系数、私人载客汽车拥有量、入、城镇居民家庭恩格尔系数、私人载客汽车拥有量、公路里程等都有密切关
16、系?如果有关系,它们之间是种公路里程等都有密切关系?如果有关系,它们之间是种什么关系?关系强度如何?什么关系?关系强度如何?(相关与回归相关与回归)(五)医学工作中常见的统计学问题(五)医学工作中常见的统计学问题案例案例 1:我的红细胞数比其他同事都低,我是病了吗?我的红细胞数比其他同事都低,我是病了吗?案例案例 2:某某医生用某药治疗胃溃疡病出血患者医生用某药治疗胃溃疡病出血患者107例,有例,有效效101例,有效率为例,有效率为94.4%。如果别的医生也用如果别的医生也用同样的药来治疗胃溃疡病出血患者,其有效率同样的药来治疗胃溃疡病出血患者,其有效率也一定是也一定是94.4%吗?吗?案例案
17、例 3:对某地对某地2530岁妇女进行一项研究发现:在服用岁妇女进行一项研究发现:在服用口服避孕药者中,宫颈癌年发病率为口服避孕药者中,宫颈癌年发病率为6/10万万,而,而未服用者为未服用者为3/10万万。据此认为服用口服避孕药是。据此认为服用口服避孕药是引起宫颈癌的危险因素,此结论正确吗?引起宫颈癌的危险因素,此结论正确吗?2023-1-1222统计工作的基本步骤统计工作的基本步骤3 35 5统计资料的分类统计资料的分类3 34 4医学统计学的定义医学统计学的定义3 31 1医学统计学的研究内容及作用医学统计学的研究内容及作用3 32 2统计中的几个基本概念统计中的几个基本概念3 33 32
18、023-1-1223 总体总体(population):根据研究目的确定的同质观察单位的全根据研究目的确定的同质观察单位的全体,更严格的说,是同质的所有观察单位某种观察值(变体,更严格的说,是同质的所有观察单位某种观察值(变量值)的集合。量值)的集合。n 样本样本(sample):是从总体中随机抽取部分观察单位,其实是从总体中随机抽取部分观察单位,其实 测值的集合。(代表性)测值的集合。(代表性)1.总体和样本总体和样本 2023-1-1224调查某地调查某地2002年年正常成年男子的正常成年男子的红细胞数的正常红细胞数的正常值范围值范围高血压患者高血压患者无时无时间、空间限制间、空间限制例如
19、:例如:一个国家的所有成年人;一个国家的所有成年人;所有的肺结核患者所有的肺结核患者总总 体体有限总体:限定于特定有限总体:限定于特定的时间与空间范围之内的时间与空间范围之内的有限个观察单位的有限个观察单位无限总体:总体是假无限总体:总体是假定的,没有时间与空间定的,没有时间与空间的限制,观察单位数只的限制,观察单位数只是理论上存在是理论上存在2023-1-1225样本的要求样本的要求 代表性代表性随机性随机性可靠性可靠性可比性可比性同质总体同质总体样本含量样本含量抽签法、抽签法、随机数字法随机数字法实验结实验结果可重复果可重复对比组间仅对比组间仅处理因素不同处理因素不同例如:例如:长沙市长沙
20、市2002年正常成年男子中随机抽取年正常成年男子中随机抽取 200名,名,其红细胞数构成一个样本其红细胞数构成一个样本案件分析:案件分析:2003年中国年中国45岁以上者的血清总胆固醇含量的调查研究岁以上者的血清总胆固醇含量的调查研究研究目的:了解特定研究对象的血清胆固醇含量研究目的:了解特定研究对象的血清胆固醇含量研究对象:研究对象:2003年中国年中国45岁以上人群岁以上人群总体总体样本样本(随机)抽样(随机)抽样全体全体2003年中国年中国45岁以上人岁以上人群(其血清总胆固醇含量)群(其血清总胆固醇含量)全体全体2003年中国年中国45岁以上岁以上人群随机抽取部分人群,人群随机抽取部分
21、人群,其血清总胆固醇含量其血清总胆固醇含量 抽样研究的意义?抽样研究的意义?抽样研究最终的目的是要通过样本来推断总抽样研究最终的目的是要通过样本来推断总体的信息体的信息,是一种是一种“以点代面以点代面,窥一斑而见全豹窥一斑而见全豹”的研究总体的方法,故抽样研究相对于直接对的研究总体的方法,故抽样研究相对于直接对总体进行研究效率更高,甚至有时对总体的研总体进行研究效率更高,甚至有时对总体的研究只能通过抽样研究来进行,如灯炮的寿命研究只能通过抽样研究来进行,如灯炮的寿命研究。究。2.参数和统计量参数和统计量parameter and statistic(随机随机)抽样抽样参数:指反映总体统计学特征
22、参数:指反映总体统计学特征的常量,一般用希腊字母表示的常量,一般用希腊字母表示如如(总体总体)均数均数 ,(总体总体)标准差标准差统计量:指描述样本数量特征的统计量:指描述样本数量特征的统计指标,常用英文字母表示统计指标,常用英文字母表示如如(样本样本)均数均数,(样本样本)标准差标准差总体总体样本样本XS值值等等。值值、值值、值值、FxtZ23.同质和变异同质和变异homogeneity and variation同质同质:就是指就是指研究对象具有相同的特征研究对象具有相同的特征。同。同质是一个范畴,是纳入和排除对象的标准。质是一个范畴,是纳入和排除对象的标准。变异变异:同质同质个体的变量值
23、的差异。个体的变量值的差异。严格地讲,严格地讲,同质是指被研究指标的影响因素相同。对不同质是指被研究指标的影响因素相同。对不同质个体的分析是没有意义的。同质个体的分析是没有意义的。2023-1-1230案例分析:案例分析:2003年中国年中国45岁以上者的血清总胆固醇含量的调查研究岁以上者的血清总胆固醇含量的调查研究研究目的:了解特定研究对象的血清胆固醇含量研究目的:了解特定研究对象的血清胆固醇含量研究对象:研究对象:2003年中国年中国45岁以上人群岁以上人群 同质:同质:变异变异:2003年、中国、年、中国、45岁以上。岁以上。研究对象研究对象的血清总胆固醇含量。的血清总胆固醇含量。案件分
24、析:案件分析:比较两种不同的治疗方法比较两种不同的治疗方法(西药和中药西药和中药)对高对高血压的控制情况血压的控制情况研究目的:比较不同治疗方法控制高血压的疗效研究目的:比较不同治疗方法控制高血压的疗效实验因素:药物实验因素:药物研究对象:根据研究目的确定的高血压病人研究对象:根据研究目的确定的高血压病人实验效应或指标:血压实验效应或指标:血压 同质:同质:年龄、病史、高血压类型、情绪等。年龄、病史、高血压类型、情绪等。变异变异:控制高血压药物的疗效。控制高血压药物的疗效。4.变量及变量值变量及变量值variable and value of variable 变变 量量:反映观察对象特征或属
25、性的量反映观察对象特征或属性的量。变量值变量值:变量变量的观察结果或测量值。的观察结果或测量值。住院号住院号年龄年龄身高身高体重体重职业职业文化程度文化程度住院天数住院天数分娩方式分娩方式定量变量定量变量 quantitative variable/数值变量数值变量 numerical variable 定性变量定性变量 qualitative variable/分类变量分类变量 categorical variable 变量及变量值示意图变量及变量值示意图身高身高体重体重肺活量肺活量性别性别42.5,41.6,40.6,140.2,141.6,142.6,女女,男男,男男,1100,1540
26、,1423,20052005年南昌市小学生体检资年南昌市小学生体检资料料变量变量变量值变量值5.误误 差差(error)误差:对被观察对象的某指标进行观察,观察值与实际的真误差:对被观察对象的某指标进行观察,观察值与实际的真值之间的差别值之间的差别。系统误差系统误差过失误差过失误差随机误差随机误差误误 差差偏差偏差(bias)过失误差:过失误差:由研究者的偶然失误造成的。由研究者的偶然失误造成的。要杜绝!要杜绝!系统误差系统误差(systematic error):由仪器或人为因素造成的,由仪器或人为因素造成的,具有方向性,可用准确度描述。具有方向性,可用准确度描述。要尽量避免此类误差!要尽量
27、避免此类误差!随机误差随机误差(random error):在抽样研究中,因抽样造成的在抽样研究中,因抽样造成的样本统计量与样本统计量、样本统计量与总体参数之间样本统计量与样本统计量、样本统计量与总体参数之间的差别。实验过程中,重复测量获得的实际值并不能稳的差别。实验过程中,重复测量获得的实际值并不能稳定在某一固定值,而是无方向地围绕某一值波动。定在某一固定值,而是无方向地围绕某一值波动。不能不能避免但可通过增加样本含量得以控制。避免但可通过增加样本含量得以控制。真实值实测值误差示意图误差示意图随机误差随机误差系统误差系统误差6.概率及小概率事件概率及小概率事件probability and
28、small probability event 概率概率:描述随机事件发生可能性大小的度:描述随机事件发生可能性大小的度量量,常用常用P(0P1)表示表示.小概率事件:小概率事件:P0.05或或P0.01的随机事件的随机事件。小概率事件无处不在!有喜有忧小概率事件无处不在!有喜有忧 航班发生空难航班发生空难 机动车发生车祸机动车发生车祸 彩票中大奖彩票中大奖 妇女怀上多胞胎妇女怀上多胞胎小概率事件的经验判断准则小概率事件的经验判断准则 一次随机试验,小概率事件是不可能发生的。一次随机试验,小概率事件是不可能发生的。2023-1-1239统计工作的基本步骤统计工作的基本步骤3 35 5统计资料的
29、分类统计资料的分类3 34 4医学统计学的定义医学统计学的定义3 31 1医学统计学的研究内容及作用医学统计学的研究内容及作用3 32 2统计中的几个基本概念统计中的几个基本概念3 33 3统计资料的类型统计资料的类型 数值变量数值变量无序分类变量无序分类变量有序分类变量有序分类变量分类变量分类变量计量资料计量资料计数资料计数资料等级资料等级资料2023-1-1241 1)计量资料计量资料(measurement data):通过:通过测定每个观察单位某项指标的大小而获得测定每个观察单位某项指标的大小而获得的资料。的资料。其变量值是定量的,表现为数值其变量值是定量的,表现为数值大小,一般有度量
30、衡单位。大小,一般有度量衡单位。例如:例如:身高、体重,住院天数身高、体重,住院天数类型:类型:连续型和离散型连续型和离散型2023-1-1242 2)计数资料:计数资料:将观察单位按某种属性将观察单位按某种属性或类别分组计数,然后汇总各组的观察或类别分组计数,然后汇总各组的观察单位个数而得到的资料。单位个数而得到的资料。其变量值是定其变量值是定性的,表现为互不相容的属性或类别。性的,表现为互不相容的属性或类别。二分类:二分类:如性别、生死、疾病有无;如性别、生死、疾病有无;多分类:多分类:如如A、B、O、AB血型。血型。类型:类型:离散型离散型2023-1-1243 3)等级资料:等级资料:
31、将观察单位按某种属性的不将观察单位按某种属性的不同程度或等级顺序分组计数,然后汇总各组观同程度或等级顺序分组计数,然后汇总各组观察单位个数而得到的资料。察单位个数而得到的资料。其变量值具有半定其变量值具有半定量性质,表现为等级大小或属性程度量性质,表现为等级大小或属性程度。例如例如:观察用某药治疗某病患者的疗效,以每名患者观察用某药治疗某病患者的疗效,以每名患者为观察单位,结果可分为治愈、显效、好转、无效四为观察单位,结果可分为治愈、显效、好转、无效四级。级。类型:类型:离散型离散型不同类型资料间的转换不同类型资料间的转换 资料的类型可以转换资料的类型可以转换 计计 量量 等等 级级 计计 数
32、数 在在对原有资料作转换后,在统计分析时要注意统计方对原有资料作转换后,在统计分析时要注意统计方法的选择和结果的解释。法的选择和结果的解释。资料类型的转换资料类型的转换2005年南昌市小学生体重资料年南昌市小学生体重资料40.537.630.846.234.8计量资料计量资料过度肥胖过度肥胖肥胖肥胖超重超重正常正常偏瘦偏瘦等级资料等级资料正常正常异常异常计数资料计数资料意义:意义:有利于选择合适的统计分析方法有利于选择合适的统计分析方法2023-1-12461 1、某地一批人的血红蛋白值资料比色、某地一批人的血红蛋白值资料比色 法测得的具体值(如法测得的具体值(如135g/L135g/L),为
33、,为 何类资料?根据测得值进行分类如何类资料?根据测得值进行分类如 “贫血贫血”),为何类资料?),为何类资料?试区分以下资料属于哪种类型?试区分以下资料属于哪种类型?2023-1-1247 观察对象观察对象 抗体滴度抗体滴度 目测判断目测判断 免疫效果免疫效果 抗体水平抗体水平 1 1:40 +有效有效 2 1:60 +有效有效 3 1:320 +有效有效 4 1:20 -无效无效 为何类资料?为何类资料?为何类资料?为何类资料?为何类资料?为何类资料?2.某疫苗皮下注射免疫结果某疫苗皮下注射免疫结果2023-1-1248 3.数据类型的相互转换数据类型的相互转换 如年龄(岁),为何类资料?
34、如年龄(岁),为何类资料?转换为转换为“未成年、成人未成年、成人”,是何类资料?,是何类资料?再转换为再转换为“婴幼儿、青年、中年、老年婴幼儿、青年、中年、老年”则又是何类资料?则又是何类资料?如治疗效果分类如治疗效果分类“无效、好转、显效、无效、好转、显效、痊愈痊愈”为何类资料?为何类资料?分别给予编码分别给予编码0,1,2,3后又为何类资料?后又为何类资料?2023-1-1249统计工作的基本步骤统计工作的基本步骤3 35 5统计资料的分类统计资料的分类3 34 4医学统计学的定义医学统计学的定义3 31 1医学统计学的研究内容及作用医学统计学的研究内容及作用3 32 2统计中的几个基本概
35、念统计中的几个基本概念3 33 32023-1-1250背景、目背景、目的、方法、的、方法、内容、经内容、经费预算费预算收集数据收集数据整理数据整理数据整理、清理、整理、清理、核实、查对核实、查对分析数据分析数据统计设计统计设计2023-1-1251 统计设计统计设计(design)是最关键的一步是最关键的一步 是对整个研究过程的总设想或总安排,是是对整个研究过程的总设想或总安排,是最关键的最关键的一步,也是最重要的一步一步,也是最重要的一步。搞好设计应具备以下条件搞好设计应具备以下条件 1.具有丰富的专业知识和水平具有丰富的专业知识和水平 2.纵阅大量的参考文献纵阅大量的参考文献 3.选准研
36、究课题选准研究课题 4.组成多学科专家队伍组成多学科专家队伍2023-1-1252 观察性研究设计:观察性研究设计:又称调查研究设计。旨在客观地描述研又称调查研究设计。旨在客观地描述研究总体,不对研究对象施加任何干预措施。究总体,不对研究对象施加任何干预措施。实验性研究设计:实验性研究设计:根据研究目的人为地对实验对象设置根据研究目的人为地对实验对象设置干预措施,通过对实验结果的分析评价其效果。干预措施,通过对实验结果的分析评价其效果。设计方案时应考虑:设计方案时应考虑:分析目的、研究对象分析目的、研究对象分析指标、观察单位、检测内容和分析指标、观察单位、检测内容和方法方法如何获取资料、怎样整
37、理计算如何获取资料、怎样整理计算如何控制误差、组织实施等如何控制误差、组织实施等 统计设计分为统计设计分为2023-1-1253 收集资料收集资料_是最基础的一步是最基础的一步(1)资料来源)资料来源 第一手资料第一手资料 经常性:统计报表(死亡登记、疫情经常性:统计报表(死亡登记、疫情 报告等),工作记录报告等),工作记录(病历、化验);(病历、化验);一时性:专题调查、实验或临床试验。一时性:专题调查、实验或临床试验。第二手资料:第二手资料:已公布的资料,如数据银行、全国、全省卫生已公布的资料,如数据银行、全国、全省卫生统计资料。统计资料。(2 2)资料要求)资料要求 完整:观察单位及观察
38、项目完整。完整:观察单位及观察项目完整。观察单位:最基本的获取观察单位:最基本的获取 数据的单元。可以是一个体,亦可以是一个单位、家庭、地区数据的单元。可以是一个体,亦可以是一个单位、家庭、地区 准确:即真实、可靠。真实是统计学的灵魂。准确:即真实、可靠。真实是统计学的灵魂。及时:即时限性。如人口普查规定调查开始日期和截止日期。及时:即时限性。如人口普查规定调查开始日期和截止日期。2023-1-1254 整理资料 整理资料即原始数据的条理化、系统化的过程。所整理资料即原始数据的条理化、系统化的过程。所采取的手段采取的手段合理化分组,合理化分组,目的目的实现专业目标。实现专业目标。质分组:质分组
39、:按事物的属性或性质分组按事物的属性或性质分组分类变量;分类变量;量分组:按数据的大小量分组:按数据的大小数值变量。数值变量。2023-1-1255(1)统计描述:)统计描述:用统计指标、统计图表对资用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。料的数量特征及分布规律进行测定和描述。(2)统计推断:)统计推断:用样本信息推断总体特征:用样本信息推断总体特征:参数估计,参数估计,假设检验。假设检验。分析资料分析资料2023-1-1256案案 例例研究研究2006年某地年某地7岁男孩的身高情况岁男孩的身高情况设计设计明确调查明确调查目的和确目的和确定研究指定研究指标标确定研究确定研
40、究对象和观对象和观察单位察单位选择调查选择调查方法方法选择调查选择调查方式方式设计设计调查表调查表样本含量样本含量的估计的估计资料的搜集资料的搜集资料的整理资料的整理资料的分析资料的分析2023-1-1257假定该地有假定该地有10万名万名7岁男孩岁男孩研究目的:研究目的:研究研究2006年某地年某地7岁男孩的身高情况岁男孩的身高情况研究对象:研究对象:2006年该地的年该地的10万个万个7岁男孩岁男孩观察单位:观察单位:研究对象中的每个研究对象中的每个7岁男孩岁男孩观察指标:观察指标:身高身高调查方法:调查方法:普查或抽样调查普查或抽样调查调查表格:调查表格:体检表体检表调查方式:调查方式:
41、体检体检(直接观察法直接观察法)样本含量:样本含量:从某地随机抽取的从某地随机抽取的200名名7岁男孩岁男孩资料搜集:资料搜集:小学生例行体格检查或专题调查研究小学生例行体格检查或专题调查研究资料整理:资料整理:核对数据并录入电脑核对数据并录入电脑资料分析:资料分析:计算平均身高和身高的标准差。计算平均身高和身高的标准差。2023-1-1258首先,首先,一定要掌握好三基,即基本知识、基本概念和基本方一定要掌握好三基,即基本知识、基本概念和基本方法。法。其次,其次,要逐步培养统计的思维方法,始终牢记概率、抽样和要逐步培养统计的思维方法,始终牢记概率、抽样和变异的存在。变异的存在。最后,最后,要
42、注意掌握每种统计方法的实际应用和应用条件。要注意掌握每种统计方法的实际应用和应用条件。最关键的,最关键的,还是要训练对实际问题进行深入分析和培养实际还是要训练对实际问题进行深入分析和培养实际处理各类资料的能力。处理各类资料的能力。六、六、如何学习医学统计学如何学习医学统计学2023-1-1259学医学统计学应注意的问题:学医学统计学应注意的问题:l 正确选用统计学方法正确选用统计学方法(1)资料类型不同)资料类型不同统计学方法不同统计学方法不同(2)设计类型不同)设计类型不同统计学方法不同统计学方法不同(3)研究目的不同)研究目的不同统计学方法不同统计学方法不同l 不管公式来源、推导,只要求了
43、解其意义、用途和应不管公式来源、推导,只要求了解其意义、用途和应用条件。用条件。举例:举例:1)看电视,知道开、关就行。)看电视,知道开、关就行。2)牛吃的是)牛吃的是草,草,挤出来的是挤出来的是牛奶牛奶。数据数据 结果2023-1-1260课后练习:课后练习:一、欲了解某地一、欲了解某地20002004年新生儿生长发育状况,年新生儿生长发育状况,为该地新生儿卫生保健提供依据。为该地新生儿卫生保健提供依据。1、研究人员感兴趣的总体是什么?、研究人员感兴趣的总体是什么?2、研究人员对总体的什么特征感兴趣,能否从专业、研究人员对总体的什么特征感兴趣,能否从专业的角度出发选择一些适当的指标对总体的这
44、些特征加的角度出发选择一些适当的指标对总体的这些特征加以描述?以描述?3、假设用你所选择的指标进行资料收集,给出这些、假设用你所选择的指标进行资料收集,给出这些资料所属的类型。资料所属的类型。2023-1-1261二、二、1976年某单位报告了果胶驱铅的疗效观察。年某单位报告了果胶驱铅的疗效观察。30名铅名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅的均数中毒工人脱离现场后住院治疗,治疗前测得尿铅的均数为为0.116mg/L,血铅均数为血铅均数为1.81mg/L,服药服药20天后再测,天后再测,尿铅均数降为尿铅均数降为0.087mg/L,血铅均数降为血铅均数降为0.73mg/L。说明说明果胶具有较好的驱铅作用。果胶具有较好的驱铅作用。1、这个研究中涉及了几个总体?、这个研究中涉及了几个总体?2、给出相应的样本;、给出相应的样本;3、上述文字中的数据的统计学意义是什么?、上述文字中的数据的统计学意义是什么?4、该研究所涉及的资料类型是什么?、该研究所涉及的资料类型是什么?2023-1-1262预预 习:习:第第3章章 计量资料的统计描述计量资料的统计描述