1、 Today:Today:Today:2022-12-72022-12-72022-12-7 生活中最重要的问题生活中最重要的问题,其中占大多数实际上只是概率的问其中占大多数实际上只是概率的问题。题。拉普拉斯拉普拉斯 在终极的分析中,一切知识都是历史。在终极的分析中,一切知识都是历史。在抽象的意义下,一切科学都是数学。在抽象的意义下,一切科学都是数学。在理性的世界里,所有的判断都是统计学。在理性的世界里,所有的判断都是统计学。C.RC.R劳劳 若想了解上帝在想什么,我们就必须学统计,因为统计若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。学就是在量测他的旨意。南丁格尔南丁
2、格尔 Today:Today:Today:2022-12-72022-12-72022-12-7 世界上有三种世界上有三种谎言谎言:谎言、该死的谎言和:谎言、该死的谎言和统计统计 Therearethreekindsoflies:lies,damnedliesandstatistics.马克马克吐温吐温自传引述十九世纪英国首相狄斯雷利的名句 Today:Today:Today:2022-12-72022-12-72022-12-7 Today:Today:Today:2022-12-72022-12-72022-12-7 Today:Today:Today:2022-12-72022-12-7
3、2022-12-7 Today:Today:Today:2022-12-72022-12-72022-12-7 Today:Today:Today:2022-12-72022-12-72022-12-7绪绪论论第一节 生物统计的地位意义第二节 生物统计学发展简史第三节 生物统计的主要内容第四节 生物统计的常用术语第五节 生物统计学教学要求 Today:Today:Today:2022-12-72022-12-72022-12-7第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7一、生物统计的概念一、生物
4、统计的概念 生物统计学:生物统计学:把概率论和数理统计的科学原理和方法应用把概率论和数理统计的科学原理和方法应用于生物科学研究中的数量资料的搜集、整理和分析的科学于生物科学研究中的数量资料的搜集、整理和分析的科学,是一门应用数学,是现代生物学研究中不可缺少的工具。是一门应用数学,是现代生物学研究中不可缺少的工具。数理统计:数理统计:是以随机现象的数量特征和分布规律为研究对是以随机现象的数量特征和分布规律为研究对象的一种数学方法。象的一种数学方法。重要任务就是重要任务就是对客观事物得出对客观事物得出本质的和规律性的认识本质的和规律性的认识,使,使人们对所研究的资料作出人们对所研究的资料作出正确的
5、结论正确的结论。第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7二、生物统计的地位二、生物统计的地位生物数学生物数学(Biomathematics):(Biomathematics):以数学方法研究和解决生物学以数学方法研究和解决生物学问题,并对生物学有关的数学方法进行理论研究,介于生物问题,并对生物学有关的数学方法进行理论研究,介于生物学和数学之间的边缘学科。从研究使用的数学方法划分,生学和数学之间的边缘学科。从研究使用的数学方法划分,生物数学可分为生物统计学、生物信息学、生物系统论、生物物数学可分
6、为生物统计学、生物信息学、生物系统论、生物控制论和生物方程等分支。控制论和生物方程等分支。第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7三、生物统计的作用三、生物统计的作用1 1、为科学地整理分析数据提供方法为科学地整理分析数据提供方法 2、判断试验结果的可靠性判断试验结果的可靠性 由于存在试验误差,从试验所得的数据资料必须借助于统计分析方法才能获得可靠的结论。3、确定事物之间的相互关系、确定事物之间的相互关系 科学试验的目的,不仅是研究事物的特征、特性,同时还要研究事物间的相互关系的联系形式。4、
7、提供试验设计的原则和方法、提供试验设计的原则和方法 5、为学习其他课程提供基础为学习其他课程提供基础第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7四、生物统计的意义四、生物统计的意义W.Gosset于1908年以“Student”笔名将“t-检验”发表于Biometrika上,文章说:“任何实验可以作为是许多可能在相同条件下作出的实验的总体中的一个个体,一系列的实验则是从这个总体所抽得的一个样品。”第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12
8、-72022-12-72022-12-7 21世纪是生命科学的世纪,无疑也为生物统计学的发展与应用拓展了广阔的空间。生物医学期刊杂志社聘请统计学专家为期刊论文把握统计处理的质量,新英格兰医学杂志、柳叶刀等著名的医学期刊还增设了负责处理统计学问题常务编委。第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7 生物统计分析软件包的普及将生物统计学从统计学家的书本里解放出来,成为生物学研究者的常用工具。但它也带来了一个严重的弊端对生物统计方法的误用与滥用。如果把整个统计分析过程变成一个黑箱,那就有可能垃圾进,垃
9、圾出(garbage in,garbage out)。第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7五、生物统计学的特点五、生物统计学的特点 CharacteristicsCharacteristics1 1、根据有限数量的样本观察数据来推断和估计事物的总体,根据有限数量的样本观察数据来推断和估计事物的总体,是生物统计的基本特点。是生物统计的基本特点。2 2、用样本来推断总体,要求样本具有一定的含量和代表性。用样本来推断总体,要求样本具有一定的含量和代表性。3 3、推断有很大的可靠性,但有一定的错误
10、率(、推断有很大的可靠性,但有一定的错误率(如假阳性如假阳性)。)。4 4、实验设计应该先于生物统计分析的思考、实验设计应该先于生物统计分析的思考!第一节第一节 生物统计的地位意义生物统计的地位意义 Today:Today:Today:2022-12-72022-12-72022-12-7第二节第二节 生物统计学发展简史生物统计学发展简史 Today:Today:Today:2022-12-72022-12-72022-12-7 最早建立生物统计思想的是最早建立生物统计思想的是A.Quetelet(1796-1874),把统计学把统计学应用于解决生物学、医学和社会学中的问题,第一个认识应用于解
11、决生物学、医学和社会学中的问题,第一个认识到大量变异数据中蕴涵规律性(近代统计学的重要思想)到大量变异数据中蕴涵规律性(近代统计学的重要思想)最早应用生物统计学的是最早应用生物统计学的是C.Darwin(1809-1882),),进化论进化论的本质是生物统计的本质是生物统计 遗传学奠基人遗传学奠基人G.Mendel的豌豆杂交实验结果也证实了生物的豌豆杂交实验结果也证实了生物统计的规律统计的规律第二节第二节 生物统计学发展简史生物统计学发展简史 Today:Today:Today:2022-12-72022-12-72022-12-7统计学用于生物学的研究,开始于统计学用于生物学的研究,开始于1
12、9世纪末,世纪末,1870年,英年,英国遗传学家,国遗传学家,Galton(1822-1911)提出了提出了相关与回归相关与回归的概念,被的概念,被公认为生物统计学的创始人。公认为生物统计学的创始人。Galton和他的继承人和他的继承人K.Plarson(1857-1936)于于1895年成立了伦年成立了伦敦大学生物统计实验室,提出了敦大学生物统计实验室,提出了 检验方法。检验方法。K.Plarson的学生的学生Gosset(1876-1937)在在1908年以年以“student”笔名笔名发表了发表了“t分布和分布和t检验法检验法”创立了小样本检验代替大样本检创立了小样本检验代替大样本检验的
13、理论和方法。验的理论和方法。Fisher于于1923年发展了显著性检验及估计理论,提出了年发展了显著性检验及估计理论,提出了F分分布和布和F检验检验,创立了正交试验设计和方差分析。,创立了正交试验设计和方差分析。1901年英国著名统计学家年英国著名统计学家Pearson创办了创办了生物统计学杂志生物统计学杂志(Biometrika),标志着生物数学发展的起点。,标志着生物数学发展的起点。第二节第二节 生物统计学发展简史生物统计学发展简史2 Today:Today:Today:2022-12-72022-12-72022-12-7Neyman(1894-1981)和和S.Pearson进行了统计
14、理论的研究工作,进行了统计理论的研究工作,提出统计假设检验系统,标志着统计学真正形成。提出统计假设检验系统,标志着统计学真正形成。There are five components to an experiment:Hypothesis(假设)(假设)Experimental design(实验设计)(实验设计)Experimental execution(实验实施)(实验实施)Statistical analysis(数据分析)(数据分析)Interpretation(描述)(描述)第二节第二节 生物统计学发展简史生物统计学发展简史 Today:Today:Today:2022-12-720
15、22-12-72022-12-7第三节第三节 生物统计的主要内容生物统计的主要内容 Today:Today:Today:2022-12-72022-12-72022-12-7统计研究设计统计研究设计 统计描述统计描述 统计分析统计分析第三节第三节 生物统计的主要内容生物统计的主要内容调查设计调查设计指调查研究工作全过程的计划。指调查研究工作全过程的计划。试验设计试验设计 是指试验研究工作进行前应用数理统计原理,制定试是指试验研究工作进行前应用数理统计原理,制定试验方案,选择试验材料验方案,选择试验材料,对实验因素作合理、有效的安排,对实验因素作合理、有效的安排,最大限度地减少,最大限度地减少试
16、验误差,使之达到高效,快速、准确试验误差,使之达到高效,快速、准确、可靠和经济的目的。、可靠和经济的目的。两者的区别两者的区别 前者前者:是被动地进行观察,希望干扰因素的影响尽可能是被动地进行观察,希望干扰因素的影响尽可能减少;减少;后者后者:研究者能较主动地安排试验因素,控制实验条件研究者能较主动地安排试验因素,控制实验条件,尽可能排除或抵消非试验因素的干扰和影响。,尽可能排除或抵消非试验因素的干扰和影响。Today:Today:Today:2022-12-72022-12-72022-12-7统计研究设计统计研究设计 统计描述统计描述 统计分析统计分析第三节第三节 生物统计的主要内容生物统
17、计的主要内容统计表和统计图统计表和统计图定量资料集中趋势的度量定量资料集中趋势的度量 算术均数、几何均数、调和均数、中位数、分位数和众数定量资料离散趋势的度量定量资料离散趋势的度量 标准差、标准误差、变异系数、极差和四分位数间距随机变量及其概率分布随机变量及其概率分布 离散型:二项分布、波松分布 连续型:正态分布、t分布、2分布、F分布 Today:Today:Today:2022-12-72022-12-72022-12-7统计研究设计统计研究设计 统计描述统计描述 统计分析统计分析第三节第三节 生物统计的主要内容生物统计的主要内容a.假设检验假设检验b.统计推断统计推断 estimativ
18、e statisticsestimative statisticsc.研究变量之间的关系研究变量之间的关系无自变量与因变量之分:无自变量与因变量之分:直线相关分析、典型相关分析研究多变量内部的从属关系:主成分分析、因子分析等。多变量之间亲疏关系:聚类分析有自变量与因变量之分:有自变量与因变量之分:直线回归分析、曲线回归分析、多项式回归分析、Logistic概率模型回归分析等d.判别分析判别分析根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的
19、常见术语 Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语1 1、总体与样本、总体与样本 Population and samplePopulation and sample 1)1)总体总体 根据研究目的确定的研究对象的全体称为总体总体。构成总体的每个成员称为个体(individual)。含有有限个个体的总体称为有限总体有限总体(finite population)(finite population)。包含有无限多个个体的总体叫无限总体无限总体(infinite population)(infini
20、te population)。2)2)样本样本 总体的一部分称为样本样本。样本中所包含的个体数目叫样本容量或大小样本容量或大小(sample size)。样本容量常记为n。通常n30的样本叫小样本小样本,n30的样本叫大样本大样本。3)抽样sampling 从总体中获得样本的过程。可分为放回式抽样(sampling with replacement)和非放回式抽样(without replacement)。随机抽样(random sampling)是确定样本代表性的有效方法。Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术
21、语生物统计的常见术语2 2、特征数、特征数 表示总体和样本的数量特表示总体和样本的数量特征的量称为特征数。征的量称为特征数。1)1)参数参数Parameter Parameter:由总体计:由总体计算得来的特征数算得来的特征数,常用希腊字希腊字母母表示。用表示总体平均数,用表示总体标准差。2)2)统计量统计量statistics statistics:由样本计:由样本计算得来的特征数算得来的特征数,常用拉丁字拉丁字母母表示统计量。用 表示样本平均数,用S表示样本标准差。3)总体参数由相应的统计量来总体参数由相应的统计量来估计估计,例如用 估计,用S估计等。xx总总体体样样本本抽抽样样描描述述计
22、算统计量计算统计量推 断统计量统计量 Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语3 3、平均数、平均数meanmean算术平均数:几何平均数:加权平均数:121.1nniixxxxxnn121nnnniiGxxxx212211nnxnxnx Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语4 4、方差、标准差和变异系数、方差、标准差和变异系数variance,standard variance,standa
23、rd deviation and variation coefficientdeviation and variation coefficient1)1)极差极差,又称范围又称范围range:range:它是样本变量中最大值和最小值之差,它是样本变量中最大值和最小值之差,一般用一般用R R表示。表示。2)2)方差方差 样本方差:总体方差:1212max,min,nnRx xxx xx22()1ixxSn22()ixN Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语4 4、方差、标准差和变异系数、方差、
24、标准差和变异系数variance,standard variance,standard deviation and variation coefficientdeviation and variation coefficient3)标准差 样本标准差:总体标准差:4)变异系数:是样本变量的相对变异量,是不带单位的纯数。用变异系数可以比较不同样本相对变异程度的大小。2()1ixxSn2()ixN100%sCVx Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语5 5、数据类型与频数(率)分布、数据类型与频
25、数(率)分布1)连续型数据和离散型数据 与某种标准做比较所得到的数据称为连续型数据(continuous data),又称度量数据(measurement data);例如,长度、时间、重量等。对连续型数据进行分析的方法,通常称为变量的方法(method of variable)。由记录不同类别个体的数目所得到的数据,称为离散型数据(discrete data),又称为计数数据(count data);例如种子数、株数、人头等。对离散型数据进行分析的方法,通常称为属性的方法(method of attribute)。Today:Today:Today:2022-12-72022-12-7202
26、2-12-72)频数(率)表frequency table用频数分布或频率分布清楚地描述数据变化规律的表格。3)频数(率)图frequency graph用频数分布或频率分布清楚地描述数据变化规律的图形。3种最常用的频数图为直方图、多边形图和累积频数图。第四节第四节 生物统计的常见术语生物统计的常见术语 Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语6 6、中位数和众数、中位数和众数median and modemedian and mode中位数:在累积频数图中中位数:在累积频数图中1/21/2总频
27、数位置上的数值。总频数位置上的数值。众数:离散型数据的众数是频数图中频数最高的组众数:离散型数据的众数是频数图中频数最高的组值;连续型数据的众数是频数图中频数最高的中值。值;连续型数据的众数是频数图中频数最高的中值。Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常见术语7 7、中心矩、原点矩、偏斜度和峭度、中心矩、原点矩、偏斜度和峭度 central monent,moment central monent,moment about the origin,skewness and kurtosisabout
28、the origin,skewness and kurtosis中心矩:原点矩:中心矩:原点矩:偏斜度:度量数据围绕众数呈不对称的程度。偏斜度:度量数据围绕众数呈不对称的程度。计算公式:计算公式:其中:其中:mm3 3为三阶中心矩;为三阶中心矩;mm2 2为二阶中心矩。为二阶中心矩。峭度:度量曲线形状的量。峭度:度量曲线形状的量。计算公式:计算公式:其中:其中:mm4 4为四阶中心矩。为四阶中心矩。2/3231mmg nxxmii)(nxmii32242mmg Today:Today:Today:2022-12-72022-12-72022-12-7第四节第四节 生物统计的常见术语生物统计的常
29、见术语8 8、随机误差与系统误差、随机误差与系统误差1)1)随机误差随机误差 random errorrandom error 也叫抽样误差抽样误差(sampling error),是由于许多无法控制的内在和外在的偶然因素所造成。统计学上的试验误差指随机误统计学上的试验误差指随机误差。差。2)系统误差 systematic error 也叫片面误差(lopsided error)。是由试验对象的差异、仪器的灵敏度、药品的用量或种类不符合试验要求以及观测、记录、计算中的错误引起的。Today:Today:Today:2022-12-72022-12-72022-12-7第五节第五节 生物统计学教
30、学要求生物统计学教学要求 Today:Today:Today:2022-12-72022-12-72022-12-7第五节第五节 生物统计学教学要求生物统计学教学要求一、生物统计学的课程特点一、生物统计学的课程特点 概念多、公式多、表格多、作业多、问题多。学生头痛的课程?老师糊涂的课程?学院怀疑的课程?对于我来说:教学压力很大而感兴趣的一门课程!对于我来说:教学压力很大而感兴趣的一门课程!Today:Today:Today:2022-12-72022-12-72022-12-7第五节第五节 生物统计学教学要求生物统计学教学要求二、基本要求1掌握正确收集试验数据的方法以及数据资料的整理方法。2.
31、掌握数据资料的基本统计分析方法。3.掌握显著性检验的基本原理与常用方法,能对不同的试验资料应用显著性检验方法进行统计分析与处理。4.掌握相关分析与回归分析的常用统计分析方法。5.掌握常用抽样调查技术和方法。6.具备一定的科学试验设计能力。Today:Today:Today:2022-12-72022-12-72022-12-7第五节第五节 生物统计学教学要求生物统计学教学要求三、学习方法1.1.弄懂基本原理和公式、理解公式的含义和应用条件,不必深究推导;2.2.认真做作业,加深对公式及统计步骤的了解;3.3.培养科学的统计思维方法。生物统计中新的思考方法从不肯定性或概率的角度从不肯定性或概率的
32、角度来思考问题和分析科学试验的结果;4.4.联系实际,结合专业,了解统计方法的实际应用;5.从实验设计方法及其原理的角度来贯穿整个生物统计学的学习过程。Today:Today:Today:2022-12-72022-12-72022-12-7第五节第五节 生物统计学教学要求生物统计学教学要求四、教学安排第一章 绪论(2学时)第二章 概率与概率分布(4学时)第三章 常见概率分布(4学时)第四章统计学的常用术语(4学时)第五章 统计推断(4学时)第六章 方差分析(单,多因素方差分析)(4学时)第七章直线回归与相关(一元,多元线性)(4学时)第八章实验设计(4学时)复习 2学时 Today:Toda
33、y:Today:2022-12-72022-12-72022-12-7国内有关经典著作国内有关经典著作1.1.概率论基础及其应用概率论基础及其应用 王梓坤著 科学出版社 1976 年版 2.数理统计引论数理统计引论陈希儒著 科学出版社 1981年版国外有关经典著作国外有关经典著作1.概率论的分析理论概率论的分析理论P.-S.拉普拉斯著 1812年版2.统计学数学方法统计学数学方法H.克拉默著 1946年版概率论的最早著作概率论的最早著作数理统计最早著作数理统计最早著作 概率统计专业概率统计专业首位中科院院士首位中科院院士 Today:Today:Today:2022-12-72022-12-7
34、2022-12-7教材教材 Today:Today:Today:2022-12-72022-12-72022-12-7主要参考书主要参考书 Today:Today:Today:2022-12-72022-12-72022-12-7主要网站主要网站http:/bio- 中国统计网http:/ SPSS俱乐部http:/ 统计软件http:/home.okstate.edu/homepages.nsf/toc/onlinetutorialsstatistics 统计学指南 Today:Today:Today:2022-12-72022-12-72022-12-7考试考试平时:平时:30%(作业,出勤,问题回答情况)考试:考试:70%(笔试)书生有路勤为径,学海无涯苦作舟。Thank you attention!