1、第三章第三章 次数分布和平均数、变异数次数分布和平均数、变异数第一节第一节 总体及其样本总体及其样本第二节第二节 次数分布次数分布第三节第三节 平均数平均数第四节第四节 变异数变异数第五节第五节 理论总体理论总体(群体群体)的平均数和标准差的平均数和标准差第一节第一节 总体及其样本总体及其样本l 总体总体(population)(population)-具有共同性质的个体所组成的集团具有共同性质的个体所组成的集团.有限总体有限总体-总体所包含的个体数目有无穷多个总体所包含的个体数目有无穷多个.无限总体无限总体-由有限个个体构成的总体由有限个个体构成的总体.l 观察值观察值(observatio
2、n)(observation)-每一个体的某一性状、特性的测每一个体的某一性状、特性的测定数值定数值.l 变数变数(variable)(variable)-观察值集合起来,称为总体的变数。观察值集合起来,称为总体的变数。变数又称为随机变数变数又称为随机变数(random variable)。l样本样本(sample)(sample)-从总体中抽取若干个个体的集合称为样从总体中抽取若干个个体的集合称为样本本(sample)。l统计数统计数(statistic)(statistic)-测定样本中的各个体而得的样本特征测定样本中的各个体而得的样本特征数,如平均数等,称为统计数数,如平均数等,称为统计
3、数(statistic)。l随机样本随机样本(random sample)(random sample)-从总体中随机抽取的样本称从总体中随机抽取的样本称为随机样本为随机样本(random sample)l样本容量样本容量 (sample size)(sample size)-样本中包含的个体数称为样本样本中包含的个体数称为样本容量或样本含量容量或样本含量(sample size)第二节第二节 次数分布次数分布一、试验资料的性质与分类一、试验资料的性质与分类二、次数分布表二、次数分布表三、次数分布图三、次数分布图一、试验资料的性质与分类一、试验资料的性质与分类(一一)数量性状资料数量性状资料(
4、二二)质量性状资料质量性状资料(一一)数量性状资料数量性状资料 数量性状数量性状(quantitative trait)的度量有计数和量测两种的度量有计数和量测两种方式,其所得变数不同。方式,其所得变数不同。1.不连续性或间断性变数不连续性或间断性变数(discontinuous or discrete(discontinuous or discrete variable)variable)指用计数方法获得的数据指用计数方法获得的数据。2.连续性变数连续性变数(continuous variable)(continuous variable)指称量、度量或测指称量、度量或测量方法所得到的数据,
5、其各个观察值并不限于整数,在两个量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。数值之间可以有微量数值差异的第三个数值存在。(二二)质量性状资料质量性状资料 质量性状质量性状(qualitative trait)(qualitative trait)指能观察而不能量测的状指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料,可有无、绒毛的有无等。要从这类性状获得数量资料,可采用下列两种方法:采用下列两种方法:1.统计次数法统计次数法 于一
6、定总体或样本内,统计其具有某个性于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。次数或相对次数。2.给分法给分法 给予每类性状以相对数量的方法给予每类性状以相对数量的方法二、次数分布表二、次数分布表(一一)间断性变数资料的整理间断性变数资料的整理(二二)连续性变数资料的整理连续性变数资料的整理(三三)属性变数资料的整理属性变数资料的整理(一一)间断性变数资料的整理间断性变数资料的整理 现以某小麦品种的每穗小穗数为例,随机采取现以某小麦品种的每穗小穗数为例,随机采取100个麦穗,计数每穗小穗数,未
7、加整理的资料列个麦穗,计数每穗小穗数,未加整理的资料列成表成表3.1。表3.1 100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917每穗小穗数每穗小穗数(y)次数次数(f)1561615173218251917205总次数总次数
8、(n)100表表3.2 100个麦穗每穗小个麦穗每穗小穗数的次数分布表穗数的次数分布表 从表从表3.2中看到,一堆杂乱的原中看到,一堆杂乱的原始资料表始资料表3.1,经初步整理后,就,经初步整理后,就可了解资料的大致情况,另外,经可了解资料的大致情况,另外,经过整理的资料也便于进一步的分析。过整理的资料也便于进一步的分析。上述资料为间断性变数资料,上述资料为间断性变数资料,每穗小穗数在每穗小穗数在1520的范围内变动,的范围内变动,把所有观察值按每穗小穗数多少加把所有观察值按每穗小穗数多少加以归类,共分为以归类,共分为6组,组与组间相差组,组与组间相差为为1小穗,称为小穗,称为组距组距。这样可
9、得表。这样可得表3.2形式的次数分布表。形式的次数分布表。(二二)连续性变数资料的整理连续性变数资料的整理兹以表兹以表3.4的的100行水稻试验的产量为例,说明整理方法。行水稻试验的产量为例,说明整理方法。177 215 197 97123 159 245 119 119 131 149 152 167 104161 214 125 175 219 118 192 176 175 95136 199 116 165214 9515883137 80138 151 187 126 196 134 206 137 98 97129 143 179 174 159 165 136 108 101 1
10、41 148 168163 176 102 194 145 173 75130 149 150 161 155 111 158131 189 91142 140 154 152 163 123 205 149 155 131 209183 97119 181 149 187 131 215 111 186 118 150 155 197116 254 239 160 172 179 151 198 124 179 135 184 168 169173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 1
11、59 177 147 194 227 141 169 124 159表表3.4 140行水稻产量行水稻产量(单位:克单位:克)具体步骤:具体步骤:1.数据排序数据排序(sort)(sort)首先对数据按从小到大排列首先对数据按从小到大排列(升序升序)或从大到小排列或从大到小排列(降序降序)。2.求极差求极差(range)(range)所有数据中的最大观察值和最小所有数据中的最大观察值和最小观察值的差数,称为观察值的差数,称为极差极差,亦即整个样本的变异幅度。,亦即整个样本的变异幅度。从表从表3.4中查到最大观察值为中查到最大观察值为254g,最小观察值为,最小观察值为75g,极差为极差为254
12、75=179g。3.确定组数和组距确定组数和组距(class interval)(class interval)根据极差分为若根据极差分为若干组,每组的距离相等,称为干组,每组的距离相等,称为组距组距。在确定组数和组距在确定组数和组距时应考虑:时应考虑:(1)观察值个数的多少;观察值个数的多少;(2)极差的大小;极差的大小;(3)便于计算;便于计算;(4)能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。样本大小样本大小(即样本内包含观察值的个数的多少即样本内包含观察值的个数的多少)与组与组数多少的关系可参照数多少的关系可参照表表3.5来确定。来确定。表3.5样本容量与组数多少的关系
13、样本内观察值的个数分组时的组数50 510100 81620010203001224500153010002040 组数确定后,还须组数确定后,还须确定组距。组距确定组距。组距=极差极差/组数。以表组数。以表3.4中中140行行水稻产量为例,样本内水稻产量为例,样本内观察值的个数为观察值的个数为140,查表查表3.5可分为可分为816组,组,假定分为假定分为12组,组,则组距为则组距为179/12=14.9g,为分组方便起见,可以,为分组方便起见,可以15g作为组距。作为组距。4.选定组限选定组限(class limit)(class limit)和组中点值和组中点值(组值,组值,class
14、value)class value)以表以表3.4中中140行水稻产量为例,选定第一组的中点行水稻产量为例,选定第一组的中点值为值为75g,与最小观察值,与最小观察值75g相等;则第二组的中点值为相等;则第二组的中点值为75+15=90g,余类推。,余类推。各组的中点值选定后,就可以求得各组组限。每组各组的中点值选定后,就可以求得各组组限。每组有两个组限,数值小的称为有两个组限,数值小的称为下限下限(lower limit)(lower limit),数值大的,数值大的称为称为上限上限(upper limit)(upper limit)。上述资料中,第一组的下限为该。上述资料中,第一组的下限为
15、该组中点值减去组中点值减去1/2组距,即组距,即75(15/2)=67.5g,上限为中,上限为中点值加点值加1/2组距,即组距,即75+(15/2)=82.5g。故第一组的组限为。故第一组的组限为67.582.5g。按照此法计算其余各组的组限,就可写出。按照此法计算其余各组的组限,就可写出分组数列。分组数列。5.把原始资料的各个观察值按分组数列的各组组限归组把原始资料的各个观察值按分组数列的各组组限归组 可按原始资料中各观察值的次序,逐个把数值归于各可按原始资料中各观察值的次序,逐个把数值归于各组。组。待全部观察值归组后,即可求得各组的次数,制成一待全部观察值归组后,即可求得各组的次数,制成一
16、个次数分布表。个次数分布表。例如表例如表3.4中第一个观察值中第一个观察值177应归于表应归于表3.6中第中第8组,组,组限为组限为172.5187.5;第二个观察值;第二个观察值149应归于第应归于第6组,组组,组限为限为142.5157.5;。依次把。依次把140个观察值都进行归个观察值都进行归组,即可制成组,即可制成140行水稻产量的次数分布表行水稻产量的次数分布表(表表3.6)。表3.6 140行水稻的次数分布组组 限限中点值中点值(y)次数次数(f)67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.51351
17、7142.5157.515020157.5172.516525172.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合计合计(n)140 注注:前面提到分为前面提到分为12组,组,但由于第一组的中点值接近但由于第一组的中点值接近于最小观察值,故第一组的于最小观察值,故第一组的下限小于最小观察值,实际下限小于最小观察值,实际上差不多增加了上差不多增加了1/2组;这样组;这样也使最后一组的中点值接近也使最后一组的中点值接近于最大值,又增加了于最大值,又增加了1/2组,组,故实际的组
18、数比原来确定的故实际的组数比原来确定的要多一个组,为要多一个组,为13组。组。(三三)属性变数资料的整理属性变数资料的整理 属性变数的资料,也可以用类属性变数的资料,也可以用类似次数分布的方法来整理。似次数分布的方法来整理。在整理前,把资料按各种质量性在整理前,把资料按各种质量性状进行分类,分类数等于组数,状进行分类,分类数等于组数,然后根据各个体在质量属性上的然后根据各个体在质量属性上的具体表现,分别归入相应的组中,具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。即可得到属性分布的规律性认识。例如,某水稻杂种第二代植株例如,某水稻杂种第二代植株米粒性状的分离情况,归于表米粒性状的
19、分离情况,归于表3.7。表3.7 水稻杂种二代植株 米粒性状的分离情况属性分组属性分组(y)次数次数(f)红米非糯红米非糯96红米糯稻红米糯稻37白米非糯白米非糯31白米糯稻白米糯稻15合计合计(n)179三、次数分布图三、次数分布图(一一)方柱形图方柱形图(二二)多边形图多边形图(三三)条形图条形图(四四)饼图饼图 (一一)方柱形图方柱形图方柱形图方柱形图(histogram)(histogram)适用于表示连续性变数的次数分布。适用于表示连续性变数的次数分布。607590105 120 135 150 165 180 195 210 225 240 255 270510152025y(产量
20、,克/行)现以表现以表3.6的的140行水稻产量的次数行水稻产量的次数分布表为例加以说分布表为例加以说明。即成方柱形次明。即成方柱形次数分布图数分布图3.1。图图3.1 140行水稻产量次数分布方柱形图行水稻产量次数分布方柱形图(二二)多边形图多边形图 多边形图多边形图(polygon)(polygon)也是表示连续性变数资料的一种普也是表示连续性变数资料的一种普通的方法,且在同一图上可比较两组以上的资料。通的方法,且在同一图上可比较两组以上的资料。607590 105 120 135 150 165 180 195 210 225 240 255 270051015202530y(产量,克/
21、行)仍以仍以140行水稻产量次行水稻产量次数分布为例,所成图形即数分布为例,所成图形即为次数多边形图为次数多边形图(图图3.2)。图图3.2 140行水稻产量次数分布多边形图行水稻产量次数分布多边形图(三三)条形图条形图 条形图条形图(bar)(bar)适用于间断性变数和属性变数资料,用以适用于间断性变数和属性变数资料,用以表示这些变数的次数分布状况。一般其横轴标出间断的中表示这些变数的次数分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。点值或分类性状,纵轴标出次数。020406080100120红米非糯红米糯稻白米非糯白米糯稻f 现以表现以表3.7水稻杂种第二水稻杂种第二代米粒
22、性状的分离情况为例,代米粒性状的分离情况为例,可画成水稻杂种第二代植株可画成水稻杂种第二代植株4种米粒性状分离情况条形图种米粒性状分离情况条形图(3.3)。图图3.3 水稻水稻F2代米粒性状分离条形图代米粒性状分离条形图(四四)饼图饼图 饼图饼图(pie)(pie)适用于间断性变数和属性变数资料,用以表适用于间断性变数和属性变数资料,用以表示这些变数中各种属性或各种间断性数据观察值在总观察个示这些变数中各种属性或各种间断性数据观察值在总观察个数中的百分比。数中的百分比。如图如图3.4中白米糯稻在中白米糯稻在F2群体中占群体中占8%,白米非糯、,白米非糯、红米糯稻和红米非糯分别红米糯稻和红米非糯
23、分别占占17%、21%和和54%。红米非糯54%红米糯稻21%白米非糯17%白米糯稻8%图3.4 水稻F2代米粒性状分离的饼图第三节第三节 平均数平均数一、平均数的意义和种类一、平均数的意义和种类二、算术平均数的计算方法二、算术平均数的计算方法三、算术平均数的重要特性三、算术平均数的重要特性四、总体平均数四、总体平均数一、平均数的意义和种类一、平均数的意义和种类 平均数的意义平均数的意义:平均数平均数(average)(average)是数据的代表值,表示资料中是数据的代表值,表示资料中观察值的中心位置,并且可作为资料的代表而与另观察值的中心位置,并且可作为资料的代表而与另一组资料相比较,借以
24、明确二者之间相差的情况。一组资料相比较,借以明确二者之间相差的情况。平均数的种类平均数的种类:(1)算术平均数算术平均数 一个数量资料中各个观察值的总和一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为除以观察值个数所得的商数,称为算术平均数算术平均数(arithmetic(arithmetic mean)mean),记作,记作 。因其应用广泛,常简称平均数或均数。因其应用广泛,常简称平均数或均数(mean)。均数的大小决定于样本的各观察值。均数的大小决定于样本的各观察值。(2)中数中数 将资料内所有观察值从大到小排序,居中间将资料内所有观察值从大到小排序,居中间位置的观察值称为位置
25、的观察值称为中数中数(median)(median),计作,计作Md。如观察值个。如观察值个数为偶数,则以中间二个观察值的算术平均数为中数。数为偶数,则以中间二个观察值的算术平均数为中数。y (3)众数众数 资料中最常见的一数,或次数最多一组的中资料中最常见的一数,或次数最多一组的中点值,称为点值,称为众数众数(mode)(mode),计作,计作MO。如棉花纤维检验时所。如棉花纤维检验时所用的主体长度即为众数。用的主体长度即为众数。(4)几何平均数几何平均数 如有如有n个观察值,其相乘积开个观察值,其相乘积开n次方,次方,即为即为几何平均数几何平均数(geometric mean)(geome
26、tric mean),用,用G代表。代表。nnnnyyyyyyyyG/1321321)(31)平均数的种类平均数的种类:二、算术平均数的计算方法二、算术平均数的计算方法 若样本较小,即资料包含的观察值个数不多,可直接若样本较小,即资料包含的观察值个数不多,可直接计算平均数。设一个含有计算平均数。设一个含有n个观察值的样本,其各个观察个观察值的样本,其各个观察值为值为y1、y2、y3、yn,则算术平均数由下式算得:,则算术平均数由下式算得:nynyyyyyniin1321(32)若样本较大,且已进行了分组若样本较大,且已进行了分组(如表如表3.6),可采用加权,可采用加权法计算算术平均数,即用组
27、中点值代表该组出现的观测值法计算算术平均数,即用组中点值代表该组出现的观测值以计算平均数,其公式为以计算平均数,其公式为nfyfyfyiii(33)其中其中yi 为第为第i 组中点值,组中点值,fi 为第为第 i 组变数出现次数。组变数出现次数。例例3.1 在水稻品种比较试验中,湘矮早四号的在水稻品种比较试验中,湘矮早四号的5个小区个小区产量分别为产量分别为20.0、19.0、21.0、17.5、18.5kg,求该品种的,求该品种的小区平均产量。小区平均产量。例例3.2 利用表利用表3.6资料计算平均每行水稻产量。资料计算平均每行水稻产量。若采用直接法,若采用直接法,=157.47。因此,两者
28、的结果十分相近。因此,两者的结果十分相近。)(2195518517021019020kg.nyy由由(32)有有)(93157140221101402551907752g.nfyyy三、算术平均数的重要特性三、算术平均数的重要特性 (1)样本各观察值与其平均数的差数样本各观察值与其平均数的差数(简称离均差,简称离均差,deviation from mean)的总和等于的总和等于0。即:。即:0)()(1yyyyinii (2)样本各观察值与其平均数的差数平方的总和,较各样本各观察值与其平均数的差数平方的总和,较各个观察值与任意其他数值的差数平方的总和为小,亦即离均个观察值与任意其他数值的差数平
29、方的总和为小,亦即离均差平方的总和最小。这个问题可作这样的说明,设差平方的总和最小。这个问题可作这样的说明,设Q为各个为各个观察值与任意数值观察值与任意数值a的差数平方的总和,即:的差数平方的总和,即:niiayQ12)(对此对此Q求最小值,可得使求最小值,可得使Q最小的最小的a 值为平均数。值为平均数。四、总体平均数四、总体平均数 总体平均数用总体平均数用 来代表,它同样具有算术平均数所具有来代表,它同样具有算术平均数所具有的特性。的特性。NyNii 1(34)上式上式yi 代表各个观察值,代表各个观察值,N代表有限总体所包含的个体代表有限总体所包含的个体数,数,表示总体内各个观察值的总和。
30、表示总体内各个观察值的总和。Niiy1第四节第四节 变异数变异数一、极差一、极差二、方差二、方差三、标准差三、标准差四、变异系数四、变异系数一、极一、极 差差 极差极差(range)(range),又称,又称全距全距,记作,记作R,是资料中最大观察,是资料中最大观察值与最小观察值的差数。例如调查两个小麦品种的每穗小值与最小观察值的差数。例如调查两个小麦品种的每穗小穗数,每品种计数穗数,每品种计数10个麦穗,经整理后的数字列于表个麦穗,经整理后的数字列于表3.8。表表3.8 两个小麦品种的每穗小穗数两个小麦品种的每穗小穗数品种名称品种名称每穗小穗数每穗小穗数总和总和平均平均甲甲13 14 15
31、17 18 18 19 21 22 2318018乙乙16 16 17 18 18 18 18 19 20 2018018 表表3.8资料中,甲品种每穗小穗数最少为资料中,甲品种每穗小穗数最少为13个,最多个,最多为为23个,个,R=2313=10个小穗;乙品种每穗小穗数最少个小穗;乙品种每穗小穗数最少为为16个,最多为个,最多为20个,个,R=2016=4个小穗。个小穗。可以看出,两品种的平均每穗小穗数虽同为可以看出,两品种的平均每穗小穗数虽同为18个,但个,但甲品种的极差较大,其变异范围较大,平均数的代表性较甲品种的极差较大,其变异范围较大,平均数的代表性较差;乙品种的极差较小,其变异幅度
32、较小,其平均数代表差;乙品种的极差较小,其变异幅度较小,其平均数代表性较好。性较好。二、方二、方 差差离均差平方和离均差平方和(简称平方和简称平方和)SS-将各个离均差平方后相加将各个离均差平方后相加样本样本SS=2)(yyi(35)总体总体SS=2)(iy(36)均方或方差均方或方差(variance)(variance)-用观察值数目来除平方和用观察值数目来除平方和 样本均方样本均方(mean square)(mean square)用用s2表示,定义为:表示,定义为:总体方差总体方差用用 表示,定义为:表示,定义为:2NyNi122)(样本均方是总体方差的无偏估计值样本均方是总体方差的无
33、偏估计值 1122nyysni)(三、标准差三、标准差(一一)标准差的定义标准差的定义 标准差标准差为方差的正平方根值,用以表示资料的变异度为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。从样本资料计算标准差的其单位与观察值的度量单位相同。从样本资料计算标准差的公式为:公式为:1)(2nyys(39)总体标准差用表示:总体标准差用表示:Ny2)(310)样本标准差是总体标准差的估计值。样本标准差是总体标准差的估计值。(二二)自由度的意义自由度的意义 自由度记作自由度记作DF,其具体数值则常用,其具体数值则常用 表示。表示。统计意义统计意义:是指样本内独立而能自由变动的离
34、均差个数。:是指样本内独立而能自由变动的离均差个数。kn 例如一个有例如一个有5个观察值的样本,因为受统计数的约束,在个观察值的样本,因为受统计数的约束,在5个离均差中,只有个离均差中,只有4个数值可以在一定范围之内自由变动取个数值可以在一定范围之内自由变动取值,而第五个离均差必须满足。如一样本为值,而第五个离均差必须满足。如一样本为(3,4,5,6,7),平均数为),平均数为5,前,前个离差为个离差为2,1,0和和1,则第,则第5个离个离均差为前均差为前4个离均差之和的变号数,即个离均差之和的变号数,即(2)=2。一般地,。一般地,样本自由度等于观察值的个数样本自由度等于观察值的个数(n)减
35、去约束条件的个数减去约束条件的个数(k),即即 。注:注:比较比较(39)和和(310),样本标准差不以样本容量,样本标准差不以样本容量n,而以自由度而以自由度n1作为除数,这是因为通常所掌握的是样本作为除数,这是因为通常所掌握的是样本资料,不知资料,不知 的数值,不得不用样本平均数的数值,不得不用样本平均数 代替代替 。与与 有差异,由算术平均数的性质有差异,由算术平均数的性质(2)可知,可知,比比 小。因此,由小。因此,由 算出的标准差将偏小。如分母算出的标准差将偏小。如分母用用n1代替,则可免除偏小的弊病。数理统计上可以证明代替,则可免除偏小的弊病。数理统计上可以证明用自由度作除数计算标
36、准差的无偏性。用自由度作除数计算标准差的无偏性。yy2)(yy2)(ynyy/)(2(三三)标准差的计算方法标准差的计算方法 1.直接法直接法 可按可按 计算,分四个步骤:计算,分四个步骤:yyy 2)(yy 2)(yy 1)(2nyys (1)先求出先求出 ,(2)再求出各个再求出各个 和各个和各个 ,(3)求和得求和得 ,(4)代入代入 算得标准差。算得标准差。1)(2nyys 例例3.3 设某一水稻单株粒重的样本有设某一水稻单株粒重的样本有5个观察值,个观察值,以克为单位,其数为以克为单位,其数为2、8、7、5、4(用用y代表代表),按照上,按照上述步骤,由表述步骤,由表3.9可算得平方
37、和为可算得平方和为22.80,把它代入,把它代入 即可得到:即可得到:这就是该水稻单株粒重的标准差为这就是该水稻单株粒重的标准差为2.39g。1)(2nyys)(3921580221)(2g.nyysyy 2)(yy 计算项目yy223.210.24482.87.846471.83.244950.20.042541.21.4416总和26022.80158平均5.2表表3.9 水稻粒重的平方和的计算水稻粒重的平方和的计算2 矫正数法矫正数法 经过转换可得经过转换可得 (311)其中其中 项称为矫正数,记作项称为矫正数,记作C。ny2)(在例在例3.3中,于表中,于表3.9第第5列写出各观察值的
38、平方值,将列写出各观察值的平方值,将有关数字代入有关数字代入(311)即有:即有:其结果和直接法算得相同。其结果和直接法算得相同。1)(2nyys122nnyys)()(392155)26(1581)(222g.nnyys3 加权法加权法 若样本较大,并已获得如表若样本较大,并已获得如表3.6的次数分布表,可采用加的次数分布表,可采用加权法计算标准差,其公式为:权法计算标准差,其公式为:1)(1)(nnyfyffyyfsiiiiiii222(312)组组 限限中点值中点值(y)次数次数(f)67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.5120
39、13127.5142.513517142.5157.515020157.5172.516525172.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合计合计(n)140表3.6 140行水稻的次数分布 例例3.4 利用表利用表3.6的次数分布资料计算每行水稻产量的次数分布资料计算每行水稻产量的标准差。的标准差。由由(312),可得,可得 若采用直接法,其标准差若采用直接法,其标准差s=36.23(g)。由此可见,直。由此可见,直接法和加权法的结果是很相近的。接法和加权法的结果是
40、很相近的。)(45.361140140)22110(25519077521)(222222gnnyfyfsiiii四、变异系数四、变异系数 变异系数变异系数(coefficient of variation)(coefficient of variation)-样本的标准差对样本的标准差对均数的百分数:均数的百分数:(315)变异系数是一个不带单位的纯数,可用以比较二个变异系数是一个不带单位的纯数,可用以比较二个事物的变异度大小。事物的变异度大小。%100ysCV 例如表例如表3.10为两个小麦品种主茎高度的平均数、标准差为两个小麦品种主茎高度的平均数、标准差和变异系数。如只从标准差看,品种甲
41、比乙的变异大些;但和变异系数。如只从标准差看,品种甲比乙的变异大些;但因两者的均数不同,标准差间不宜直接比较。如果算出变异因两者的均数不同,标准差间不宜直接比较。如果算出变异系数,就可以相互比较,这里乙品种的变异系数为系数,就可以相互比较,这里乙品种的变异系数为11.3%,甲品种为甲品种为9.5%,可见乙品种的相对变异程度较大。,可见乙品种的相对变异程度较大。品种品种 (cm)s(cm)变异系数变异系数CV(%)甲甲95.09.02 9.5乙乙75.08.5011.3表表3.10 两个小麦品种主茎高度的测量结果两个小麦品种主茎高度的测量结果y第五节第五节 理论总体理论总体(群体群体)的平均数和
42、标准差的平均数和标准差 设总体的第设总体的第 i 个构成成分的概率为个构成成分的概率为pi,其平均数为,其平均数为 ,那么总体的平均数为:那么总体的平均数为:i)(iip(316)总体的方差为:总体的方差为:)(22iip(317)例例3.5 由单个位点控制的数量性状,由单个位点控制的数量性状,F2代有三种基代有三种基因型,这三种基因型值分别为因型,这三种基因型值分别为m+d,md和和m+h,而这,而这三种基因型的理论频率分别为三种基因型的理论频率分别为0.25,0.25和和0.5,因而可以,因而可以计得其平均数为:计得其平均数为:其方差为其方差为:2222)(5.0)(25.0)(25.0hmdmdm将总体平均数代入上式,化简的方差为:将总体平均数代入上式,化简的方差为:2224121hd)(5.0)(25.0)(25.0hmdmdm总体的构成成分总体的构成成分频率频率(f)平均数平均数10.25m+d20.25md30.50m+h表表3.11 F2群体的遗传构成群体的遗传构成