1、核数据处理核数据处理第0章 预备知识东华理工大学 张怀强随着测量工作的深入和技术的进步,对获取的随着测量工作的深入和技术的进步,对获取的大量数据的处理要求愈来愈高,特别是核辐射大量数据的处理要求愈来愈高,特别是核辐射测量,实验数据的统计性、随机性十分突出,测量,实验数据的统计性、随机性十分突出,为了从大量实验数据中获得充分可靠的信息,为了从大量实验数据中获得充分可靠的信息,并总结出一定的规律,就必须对纷繁的大量的并总结出一定的规律,就必须对纷繁的大量的实验数据进行必要的分析、处理。实验数据进行必要的分析、处理。该课程是该课程是“核技术核技术”专业的一门重要专业课,专业的一门重要专业课,该课程与
2、后续教学环节该课程与后续教学环节“程序设计实习程序设计实习”一起,一起,构成了学生计算机核数据处理能力培养的一个构成了学生计算机核数据处理能力培养的一个重要教学环节。重要教学环节。东华理工大学 张怀强课程目的:课程目的:利用计算机技术,对放射性(核辐射)测量利用计算机技术,对放射性(核辐射)测量数据进行处理、分析、成图成像和解释。数据进行处理、分析、成图成像和解释。课程要求:课程要求:掌握各种数据处理方法的掌握各种数据处理方法的基本思路及原理基本思路及原理;掌握各种数据处理方法的掌握各种数据处理方法的使用条件及效果使用条件及效果;对一些方法能在计算机上编程实现。对一些方法能在计算机上编程实现。
3、东华理工大学 张怀强核物理实验数据处理,吴学超,冯正水编著,原子能出版社核物理实验数据处理,吴学超,冯正水编著,原子能出版社能谱数据处理,庞巨丰著,陕西科学技术出版社能谱数据处理,庞巨丰著,陕西科学技术出版社误差与数据处理,刘智敏编著,原子能出版社误差与数据处理,刘智敏编著,原子能出版社铀矿物化探数据处理方法铀矿物化探数据处理方法,张锦由编张锦由编,原子能出版社原子能出版社C C语言数值算法程序大全,语言数值算法程序大全,W.H.PressW.H.Press等著,傅祖芸等译,电等著,傅祖芸等译,电子工业出版社子工业出版社物探与化探物探与化探物化探计算技术物化探计算技术核技术核技术等等Geoph
4、ysical Research LettersGeophysical Research LettersX-ray SpectrumX-ray SpectrumGeophysicsGeophysicsetet al.al.其他其他东华理工大学 张怀强内容内容核辐射测量数据核辐射测量数据放射性测量中的统计性放射性测量中的统计性误差误差样本统计量及分类样本统计量及分类东华理工大学 张怀强核辐射测量仪器的组成核辐射测量仪器的组成核辐射核辐射探测器探测器前置前置电路电路线性脉冲线性脉冲放大器放大器积分积分甄别器甄别器率计电路率计电路计数器计数器脉冲幅度脉冲幅度分析器分析器辅助电路辅助电路计数器计数器多道
5、脉冲多道脉冲幅度分析器幅度分析器接口电路接口电路计算机计算机系统系统应用应用软件软件高压高压电源电源低压低压电源电源(a)(b)(c)(a)总量测量仪器(b)能谱测量仪器(c)全谱测量仪器总量测量仪总量测量仪东华理工大学 张怀强核辐射测量所得的数据核辐射测量所得的数据总量测量仪器总量测量仪器所测得的数据:所测得的数据:一个数据一个数据单个单个计数计数值值 经刻度和计算所得的经刻度和计算所得的活度活度、剂量剂量、浓度浓度等量值等量值所需的数据处理:所需的数据处理:预处理(数据的检验、选择、转换等)预处理(数据的检验、选择、转换等)统计分析统计分析成图成像成图成像东华理工大学 张怀强核辐射测量仪器
6、的组成核辐射测量仪器的组成核辐射核辐射探测器探测器前置前置电路电路线性脉冲线性脉冲放大器放大器积分积分甄别器甄别器率计电路率计电路计数器计数器脉冲幅度脉冲幅度分析器分析器辅助电路辅助电路计数器计数器多道脉冲多道脉冲幅度分析器幅度分析器接口电路接口电路计算机计算机系统系统应用应用软件软件高压高压电源电源低压低压电源电源(a)(b)(c)(a)总量测量仪器(b)能谱测量仪器(c)全谱测量仪器能谱测量仪能谱测量仪东华理工大学 张怀强核辐射测量所得的数据核辐射测量所得的数据能谱测量仪器能谱测量仪器所测得的数据:几个数据几个几个计数计数值值 经刻度和计算所得的经刻度和计算所得的活度活度、含量含量、浓度浓
7、度等量值等量值所需的数据处理:预处理(数据的检验、选择、转换等)预处理(数据的检验、选择、转换等)统计分析统计分析成图成像成图成像东华理工大学 张怀强核辐射测量仪器的组成核辐射测量仪器的组成核辐射核辐射探测器探测器前置前置电路电路线性脉冲线性脉冲放大器放大器积分积分甄别器甄别器率计电路率计电路计数器计数器脉冲幅度脉冲幅度分析器分析器辅助电路辅助电路计数器计数器多道脉冲多道脉冲幅度分析器幅度分析器接口电路接口电路计算机计算机系统系统应用应用软件软件高压高压电源电源低压低压电源电源(a)(b)(c)(a)总量测量仪器(b)能谱测量仪器(c)全谱测量仪器全谱测量仪全谱测量仪东华理工大学 张怀强核辐射
8、测量所得的数据核辐射测量所得的数据全谱测量仪器(多道能谱仪)全谱测量仪器(多道能谱仪)所测得的数据:一条谱线 几百或几千个几百或几千个计数值(即一个数组)计数值(即一个数组)例如:例如:int data1024所需的数据处理:谱数据处理谱数据处理-多个累计计数多个累计计数(面积面积)、含量、活度等、含量、活度等预处理(数据的检验、选择、转换等)预处理(数据的检验、选择、转换等)统计分析统计分析成图成像成图成像东华理工大学 张怀强数据的特性数据的特性1.随机性随机性主要包括两个方面:主要包括两个方面:1)被测对象被测对象是随机的是随机的产生射线的事件不能实现预言,也不能再现,但可以确定它出现的产
9、生射线的事件不能实现预言,也不能再现,但可以确定它出现的概率。概率。2)测量过程测量过程中也存在各种随机因素的影响中也存在各种随机因素的影响测量过程中,由于测量条件的随机变化,或测量仪器和方法不够精测量过程中,由于测量条件的随机变化,或测量仪器和方法不够精密等原因,也会带来随机误差。密等原因,也会带来随机误差。随机性随机性是固有特性。数据的随机性决定了数据处理方是固有特性。数据的随机性决定了数据处理方法法建立在概率统计基础上。建立在概率统计基础上。东华理工大学 张怀强数据的特性数据的特性2.局限性局限性由于被测对象的隐秘性和复杂性,以及方法的能力有由于被测对象的隐秘性和复杂性,以及方法的能力有
10、限,致使获得的限,致使获得的数据数据具有一定的局限性具有一定的局限性,不能反映被不能反映被测对象的全体测对象的全体。3.混合性混合性数据的混合性是指数据数据的混合性是指数据来自多个对象的特性来自多个对象的特性。例如,例如,谱数据中的每道计数值谱数据中的每道计数值(即每种能量的射线统计个数即每种能量的射线统计个数),可能来自不同的元可能来自不同的元(核核)素。素。4.空间性空间性东华理工大学 张怀强数据的分类数据的分类1.测量型测量型数据数据测量型数据指测量型数据指连续性的观测值连续性的观测值,它们之间不仅它们之间不仅能能比较大小比较大小,而且能而且能定量地表示其间的差异定量地表示其间的差异。例
11、如各种仪器的观测值、化学元素的分析值等例如各种仪器的观测值、化学元素的分析值等2.计数型计数型数据数据计数型数据指以计数型数据指以不连续的个数不连续的个数为计数特征的数为计数特征的数据。例如核素的辐射粒子数、异常点数等。据。例如核素的辐射粒子数、异常点数等。东华理工大学 张怀强数据的分类数据的分类3.级序型级序型数据数据级序型数据又称级序型数据又称等级型等级型数据,是数据,是离散型数据离散型数据的一种。的一种。这类数据是按等级划分的具有等级顺序的数据,例如这类数据是按等级划分的具有等级顺序的数据,例如异常等级数、场晕等级数等数据异常等级数、场晕等级数等数据。4.状态型状态型数据数据状态型状态型
12、数据指用逻辑数字数据指用逻辑数字“-1,0,+1”表示事物状表示事物状态的数据。包括二态型数据和三态型数据。通常二态态的数据。包括二态型数据和三态型数据。通常二态型数据用型数据用“0,1”表示表示“无,有无,有”。例如无异常和有异。例如无异常和有异常常。东华理工大学 张怀强数据的分类数据的分类5.名义型名义型数据数据这类数据没有量的概念,只起一种代码作用。它常用这类数据没有量的概念,只起一种代码作用。它常用于描述不包含相对重要性或相对变化的对象。如描述于描述不包含相对重要性或相对变化的对象。如描述异常性质等。异常性质等。如,用名义型数据描述放射性异常性质,可以用如,用名义型数据描述放射性异常性
13、质,可以用“1”、“2”、“3”代表代表“铀异常铀异常”、“钍异常钍异常”、“钾异常钾异常”进行处理。这里进行处理。这里“2”不是两个不是两个“1”的和,也不意味着的和,也不意味着“2”比比“1”大,它们只是区分研究对象的某种标志的大,它们只是区分研究对象的某种标志的符号。符号。东华理工大学 张怀强内容核辐射测量数据核辐射测量数据放射性测量中的统计性放射性测量中的统计性误差误差样本统计量及分类样本统计量及分类东华理工大学 张怀强核衰变核衰变进行核测量时,进行核测量时,条件条件虽然虽然相同相同,但测量,但测量结结果不完全相同果不完全相同,甚至相差很大,这是由于,甚至相差很大,这是由于“核衰变核衰
14、变”本身具有本身具有统计特性统计特性。东华理工大学 张怀强顺序s-1顺序s-1顺序s-1顺序s-1顺序s-1122154146138152322142262182533236435631832442424446428415325445265585662266464663864732724756748768228348668188597290498692891102303503702901113313510712914126324523724922134333534733937145343544748945156350553751954163361562763965171037757277297
15、31843855847829831953935947929932054066018041004东华理工大学 张怀强o但数值虽有差异,多数均在但数值虽有差异,多数均在平均值平均值左右出现左右出现对原始数据的简单对原始数据的简单整理整理单位时间内单位时间内的计数的计数(n)012345计数为计数为n的的出现次数出现次数p(n)31118221913计数为计数为n的的出现概率出现概率P(n)0.030.110.180.220.190.13单位时间内单位时间内的计数的计数(n)678910计数为计数为n的的出现次数出现次数p(n)74201计数为计数为n的的出现概率出现概率P(n)0.070.040.
16、020.000.01东华理工大学 张怀强核衰变的规律核衰变的规律 这个这个平均值平均值,又称,又称数学期望数学期望值值统计误差:各次测量值统计误差:各次测量值围绕平均值围绕平均值涨落的误差涨落的误差衰变规律衰变规律:n个原子核,个原子核,t时间内,任一原子核发时间内,任一原子核发生生衰变的概率衰变的概率为:为:不发生的概率为:不发生的概率为:tep1peqt1东华理工大学 张怀强核衰变的统计规律核衰变的统计规律二项分布二项分布k次次试验,试验,每次试验每次试验有有两种可能两种可能发生或不发发生或不发生,所以满足二项分布。生,所以满足二项分布。则则t时间内,时间内,n个原子核发生衰变的概率满足个
17、原子核发生衰变的概率满足二二项分布项分布规律。规律。k,p是决定分布的两个参数:是决定分布的两个参数:数学期望数学期望E为:为:kp;方差方差D为:为:kpq。nknqpnknknP)!(!)(东华理工大学 张怀强核衰变的统计规律核衰变的统计规律泊松分布泊松分布当(通常)当(通常)k很大很大,而核衰变的概率,而核衰变的概率p很小很小,满足泊松分布。满足泊松分布。决定分布的只有一个参数:决定分布的只有一个参数:;数学期望为:;数学期望为:;方差为:;方差为:。当。当值小时,曲线左右不值小时,曲线左右不对称对称,当,当增大时分布趋于对称。增大时分布趋于对称。均方差与平均值的关系为:均方差与平均值的
18、关系为:nkpennPknlim!)(nn2东华理工大学 张怀强核衰变的统计规律核衰变的统计规律高斯分布高斯分布当当值较小(值较小(16)时,则满足)时,则满足高斯分布高斯分布。决定分布的有决定分布的有两个参数:两个参数:,;数学期望为:;数学期望为:(分布(分布的位置);方差为:的位置);方差为:(分布的宽窄)。(分布的宽窄)。均方差与数学期望与平均值的关系为均方差与数学期望与平均值的关系为:)(2121)(222/)(21/)(21xfeennpxnnnnn2东华理工大学 张怀强核衰变的统计规律核衰变的统计规律高斯分布高斯分布例:在时间例:在时间t内,放射源放出粒子的平均值内,放射源放出粒
19、子的平均值100。试求:在时间试求:在时间t内放出内放出108个粒子的概率。个粒子的概率。解:解:03.01014.321)108(100/)100108(212ep100n平均值10n均方差)(2121)(222/)(21/)(21xfeennpxnnn东华理工大学 张怀强核辐射测量中,核辐射测量中,待测物理量本身是随机变量待测物理量本身是随机变量,准确值是计数值的数学期望,即无限次测量准确值是计数值的数学期望,即无限次测量的平均值(真平均值),但实际只能进行有的平均值(真平均值),但实际只能进行有限次测量,即样本,把样本的平均值作为真限次测量,即样本,把样本的平均值作为真平均值,故而存在着
20、误差,即平均值,故而存在着误差,即统计误差统计误差。统计误差规律统计误差规律%5067.0%7.9933%5.9522%3.68nnnnnnnnnn东华理工大学 张怀强内容内容核辐射测量数据核辐射测量数据放射性测量中的统计性放射性测量中的统计性误差误差样本统计量及分类样本统计量及分类东华理工大学 张怀强误差的来源误差的来源设备设备误差:测量设备本身带来的误差误差:测量设备本身带来的误差方法方法误差:由于测量方法或计算方法不完善造误差:由于测量方法或计算方法不完善造成的误差成的误差环境环境误差:由于测量的环境条件的影响而引入误差:由于测量的环境条件的影响而引入的误差(如温度、气压、振动、电磁场等
21、等)的误差(如温度、气压、振动、电磁场等等)人员人员误差:包括人员的视差、观测误差和估读误差:包括人员的视差、观测误差和估读误差等误差等被测对象被测对象东华理工大学 张怀强误差的分类误差的分类性质性质系统误差系统误差:同条件测量多次,误差的:同条件测量多次,误差的绝对值绝对值和和符符号号保持保持恒定恒定。随机误差随机误差(偶然误差):同条件测量多次,误差(偶然误差):同条件测量多次,误差的的绝对值和符号绝对值和符号都变都变,服从一定的规律服从一定的规律。待测物待测物理量理量本身本身存在不变的确定值存在不变的确定值,误差是由于测量条,误差是由于测量条件、设备、方法等造成的。件、设备、方法等造成的
22、。统计误差统计误差:核辐射测量中,:核辐射测量中,待测物理量待测物理量本身本身是是随机变量随机变量,准确值是计数值的数学期望,准确值是计数值的数学期望,即无限次测量的平均值(真平均值),但实即无限次测量的平均值(真平均值),但实际只能进行有限次测量,即样本,把样本的际只能进行有限次测量,即样本,把样本的平均值作为真平均值,故而存在着误差,即平均值作为真平均值,故而存在着误差,即统计误差。不是由于测量条件等造成的。统计误差。不是由于测量条件等造成的。粗大误差粗大误差:在规定的测量条件下,测量值显:在规定的测量条件下,测量值显著地偏离实际值时所对应的误差。属于异常著地偏离实际值时所对应的误差。属于
23、异常值,应按一定规则剔除。值,应按一定规则剔除。东华理工大学 张怀强精度精度精密度精密度:表示测量结果中:表示测量结果中随机误差随机误差大小的程大小的程度。度。正确度正确度:表示测量结果中:表示测量结果中系统误差系统误差大小的程大小的程度。度。准确度准确度:表示测量结果与真值的一致程度,:表示测量结果与真值的一致程度,是测量结果中是测量结果中系统误差与随机误差系统误差与随机误差的综合。的综合。东华理工大学 张怀强一般测量随机误差与核辐射测量统计误差的对比一般测量随机误差与核辐射测量统计误差的对比异(不同)异(不同)一般测量:一般测量:待测物理量本身待测物理量本身存在不变的存在不变的确定值确定值
24、,误差是由,误差是由于测量条件、设备、方法等造成的;于测量条件、设备、方法等造成的;与与无联系无联系 核辐射测量:核辐射测量:待测物理量本身是随机的待测物理量本身是随机的,不是由于测量条,不是由于测量条件等造成的;件等造成的;与与有联系有联系 同同测量中测量中存在存在随机性随机性误差误差分布分布相同(高斯分布)相同(高斯分布)表示和处理方法表示和处理方法相同(随机误差方法)相同(随机误差方法)东华理工大学 张怀强统计误差的统计误差的表示方法表示方法与随机误差相同,用相应于一定置信概率的置信区间来表示。与随机误差相同,用相应于一定置信概率的置信区间来表示。最常用的方法使用标准误差最常用的方法使用
25、标准误差:标准误差标准误差:有:有两种两种表示方式表示方式(1)均方差均方差:(2)标准偏差标准偏差S:NNnn1)(12nnnSnii当不存在其它误差时,(当不存在其它误差时,(1)=(2););存在其它误差时,存在其它误差时,(2)(1)。东华理工大学 张怀强若只进行了一次测量,得计数若只进行了一次测量,得计数N,则可以把测量结果,则可以把测量结果表示成表示成:这种写法的含义是,给出了真平均值的置信概率为这种写法的含义是,给出了真平均值的置信概率为0.683的置信区的置信区间,也就是在该区间,每间,也就是在该区间,每100个中平均有个中平均有68个是包含了真平均值的。个是包含了真平均值的。
26、相对误差相对误差表示精度。表示精度。n越大,精确度越高。越大,精确度越高。例:例:NNNNnnn1)1()11(nnnn=1000时,时,=3.3%n=10000时,时,=1%东华理工大学 张怀强1.在时间在时间t内,放射源放出粒子的平均值内,放射源放出粒子的平均值100。试求:在时间试求:在时间t内放出内放出103个粒子的概率。个粒子的概率。2.测量计数值测量计数值n为为100,则绝对误差和相对,则绝对误差和相对误差各为多少?误差各为多少?东华理工大学 张怀强预备知识预备知识习题习题1.1.在时间在时间t t内,放射源放出粒子的平均值内,放射源放出粒子的平均值100100。试求:在时间试求:
27、在时间t t内放出内放出103103个粒子的概率。个粒子的概率。2.2.测量计数值测量计数值n n为为100100,则绝对误差和相对误,则绝对误差和相对误差各为多少?差各为多少?038.01014.321)108(100/)100103(212ep100n平均值10n均方差10100 绝对误差%10100100r相对误差解解:解解:东华理工大学 张怀强为了提高测量精度,重要的途径是提高计数为了提高测量精度,重要的途径是提高计数。所以为了保证有足够的计数,使测量结果达到所以为了保证有足够的计数,使测量结果达到一定的精度,一般采用方法:一定的精度,一般采用方法:采用灵敏度高的探测器;采用灵敏度高的
28、探测器;增加放射源的强度;增加放射源的强度;延长延长测量测量时间时间;增多增多测量测量次数次数;减少减少测量时的测量时的本底计数本底计数。东华理工大学 张怀强延长计数时间延长计数时间对精度的影响对精度的影响计数率计数率n0(单位时间内的计数)一定,观测时间(单位时间内的计数)一定,观测时间t内的计数为内的计数为N=n0t,则单位时间的计数可写成:,则单位时间的计数可写成:t时间内的时间内的n0的误差的误差绝对误差绝对误差相对误差相对误差)11(000000tnntnnttnttntNtN)1(1)(10,00,000000000ntnnntntnrnrnnrnnNn东华理工大学 张怀强增加测量
29、次数增加测量次数对精度的影响对精度的影响 重复测量重复测量k次次,每次所得计数率为:,每次所得计数率为:n1,n2,n3,nk,则平均计数为:,则平均计数为:而总计数为:而总计数为:,标准误差为:,标准误差为:,则平均,则平均计数为:计数为:平均值的误差平均值的误差:绝对误差绝对误差相对误差相对误差knnkii1nknk)11(nknknnnnknnknknkknnrNn111,东华理工大学 张怀强本底计数本底计数对测量精度的影响对测量精度的影响 减小本底减小本底若两个数分别为:若两个数分别为:和和 ,则有:,则有:相加时为:相加时为:相减时为:相减时为:相乘时为:相乘时为:相除时为相除时为:
30、则扣除本底计数时的样品净计数率则扣除本底计数时的样品净计数率nc可表示为:可表示为:aanbbn22)(babann22)(babann)1)(2222bbaabannnn)1)(/(2222bbaabannnnbbaabababactntnnnnnn)()(22东华理工大学 张怀强在给定时间在给定时间T内做放射性测量来确定源的计数内做放射性测量来确定源的计数率,测量总的放射性的时间率,测量总的放射性的时间ta和测量本底的时和测量本底的时间间tb在怎样的比例关系下结果的误差才最小在怎样的比例关系下结果的误差才最小?abaabbaatTntntntn0abaaatTntndtdbababbaba
31、anntttntTntn或222)(n 解:误差为:解:误差为:要使误差最小,必须要使误差最小,必须则有:则有:东华理工大学 张怀强给定最小的相对误差,所需的最小测量时间Tmin=?由两个方程:由两个方程:aabbabbabaatnnTnntTnnnnt11122min22)1(1)1(1babbabnnnTnnTnbabababbaabarnnttnntntnnn解得:解得:东华理工大学 张怀强例例1:已知:已知本底计数率为本底计数率为40/min,总的计数,总的计数率为率为160/min,要求相对标准误差小于等于,要求相对标准误差小于等于1%,求测量本底计数及总计数的时间至少各,求测量本底
32、计数及总计数的时间至少各为多少?为多少?%1,40,440160minbbannnmin250)14(01.040122minTmin3.83*41min7.166414minabattTtn 解:解:22min)1(1babnnnT东华理工大学 张怀强例例2:若减小本底,使:若减小本底,使本底计数率为本底计数率为10/min,则总计数率为则总计数率为130/min,要达到同样的相对,要达到同样的相对标准误差,所需要的时间为多少?标准误差,所需要的时间为多少?%1,10,1310130minbbannnmin9.147)113(01.010122minTmin2.32*131min7.1151
33、3113minabattTto 解:解:22min)1(1babnnnT东华理工大学 张怀强结论结论增加测量次数增加测量次数和和延长测量时间延长测量时间都可以提高都可以提高测量精度,但重复多次测量不方便,所以测量精度,但重复多次测量不方便,所以一般采用一般采用延长测量时间延长测量时间和做和做两三次重复测两三次重复测量量。尽可能尽可能降低本底降低本底。东华理工大学 张怀强内容内容核辐射测量数据核辐射测量数据放射性测量中的统计性放射性测量中的统计性误差误差样本统计量及分类样本统计量及分类东华理工大学 张怀强集中性集中性统计量统计量反映反映分布的集中趋势分布的集中趋势,作为大量数据的整体性代,作为大
34、量数据的整体性代表表统计量:统计量:算术平均数算术平均数几何平均数几何平均数中位数中位数Me众数众数Mq东华理工大学 张怀强算术平均数算术平均数设设z1,z2,zk为一个样本,则算术平均数为一个样本,则算术平均数为:为:物理意义:该值为各个数值的物理意义:该值为各个数值的平衡点或重平衡点或重心心。(在物化探工作中,常作为岩石中的。(在物化探工作中,常作为岩石中的元素元素背景值背景值或矿体或矿体平均品位平均品位的估计值)的估计值)ZkiizkZ11东华理工大学 张怀强几何平均数设设z1,z2,zk为一个样本,则几何平均数为一个样本,则几何平均数为:为:计算时,计算时,取对数取对数进行算术平均值的
35、计算,进行算术平均值的计算,即:即:然后,再然后,再取反对数取反对数得:得:LZkkLzzzZ.21kiiLzkZ1log1logLZ东华理工大学 张怀强中位数中位数Me将样本的数据将样本的数据从小到大(或从大到小)依次排序从小到大(或从大到小)依次排序,位居中间位居中间的那个数值,即为中位数。即:的那个数值,即为中位数。即:优点:求法简单,与数列两端的数值变化无关优点:求法简单,与数列两端的数值变化无关众数众数Mq具具最大频数最大频数(最大频率分布密度)的自变量的值(最大频率分布密度)的自变量的值)2(kzMe东华理工大学 张怀强集中性统计量集中性统计量在在对称曲线对称曲线中,中位数、众数、
36、平均数三者中,中位数、众数、平均数三者重合重合在在非对称曲线非对称曲线中,中位数在众数和平均数之间中,中位数在众数和平均数之间测值z频数(频率)Mq Me Z东华理工大学 张怀强离散性离散性统计量统计量反映反映数据分布的离散程度数据分布的离散程度,是是统计误差大统计误差大小小的量度,常用来反映数据的波动性质的量度,常用来反映数据的波动性质统计量统计量极差(极差(d)方差(方差(s2或或2)或均方差(标准差)(或均方差(标准差)(s或或)变异系数(变化系数)(变异系数(变化系数)(B)或然误差(或然误差()算术平均误差(算术平均误差()东华理工大学 张怀强极差极差d它是样本值中它是样本值中最大值
37、最大值与与最小值最小值之之差差。极差计算简单。但不能充分提供有用的信息极差计算简单。但不能充分提供有用的信息kizzdii,.2,1,minmax东华理工大学 张怀强方差方差s2,2或或均方差均方差(标准差)(标准差)s,常用来描述常用来描述数据波动性数据波动性的两个统计量。二的两个统计量。二者能较好地提供有用信息,反映者能较好地提供有用信息,反映数据的离数据的离散程度散程度。计算公式:计算公式:kiikiizzkzzks1212)(11)(1(K30K30时用)时用)东华理工大学 张怀强方差方差s2,2或均方差(标准差)或均方差(标准差)s,计算公式:计算公式:性质:三个性质:三个1)若各值
38、)若各值zi=c(常数),则(常数),则sc=02)s(zi+c)=s(zi)3)s(c*zi)=c*s(zi)kiikiizzkzzks1212)(11)(1(K30K0时,频率分布向时,频率分布向正方向正方向偏斜偏斜2)g1 0时,陡峭程度时,陡峭程度超过超过正态分布正态分布2)g2 0时,陡峭程度时,陡峭程度低于低于正态分布正态分布3)g2=0时,为正态分布时,为正态分布3442sVgzf(z)123东华理工大学 张怀强协方差矩阵和相关系数矩阵对对两个或两个以上两个或两个以上的的随机变量随机变量,不仅要描,不仅要描述各变量的均值和方差等,还常常要描述述各变量的均值和方差等,还常常要描述它
39、们它们之间的相互关系之间的相互关系。设有一个二元样本设有一个二元样本(x1,y1),(x2,y2),(xk,yk)N+L阶阶原点混合矩原点混合矩:N+L阶阶中心混合矩中心混合矩:kiLiNiyxk11kiLiNiyyxxk1)()(1东华理工大学 张怀强协方差矩阵和相关系数矩阵协方差矩阵和相关系数矩阵设有一个二元样本设有一个二元样本(x1,y1),(x2,y2),(xk,yk)协方差协方差cov(x,y):当:当N=L=1时的时的中心混合矩中心混合矩。协方差的性质:协方差的性质:1)cov(x,y)=cov(y,x)2)cov(a*x,b*y)=a*b*cov(x,y)3)cov(x1+x2,
40、y)=cov(x1,y)+cov(x2,y)kiiiyyxxkyx1)(1),cov(东华理工大学 张怀强协方差矩阵和相关系数矩阵协方差矩阵和相关系数矩阵相关系数相关系数rx,y:kikiiikiiiyxyxyyxxyyxxssyxr11221,)()()(),cov(东华理工大学 张怀强协方差矩阵和相关系数矩阵设有一个二元样本设有一个二元样本(x1,y1),(x2,y2),(xk,yk)两个变量两个变量的的协方差矩阵协方差矩阵:是:是对称矩阵对称矩阵kiikiiikiiyykyyccyxxycyyxxkyxcxxkxxc122212211121211)(1),cov(),cov(),cov(
41、)(1),cov()(1),cov(22211211cccc东华理工大学 张怀强协方差矩阵和相关系数矩阵设有一个二元样本设有一个二元样本(x1,y1),(x2,y2),(xk,yk)对于对于m个变量个变量的的协方差矩阵协方差矩阵:ktjjtiitjiijktiitiixxxxkccxxkc112)(1)(1mmmmmmccccccccc212222111211mmmmmmrrrrrrrrrR212222111211n 协方差受变量的量纲和数量级不一致的影响,所以,常由相关系数组成相关矩阵东华理工大学 张怀强1.已知本底计数率为已知本底计数率为10/min,总的计数率,总的计数率为为160/mi
42、n,要求相对标准误差小于等于,要求相对标准误差小于等于1%,求测量本底计数及总计数的时间至少,求测量本底计数及总计数的时间至少各为多少?各为多少?2.分别测量分别测量10分钟得计数率分钟得计数率1010cpm,则计则计数率的绝对误差和相对误差各为多少?数率的绝对误差和相对误差各为多少?东华理工大学 张怀强3.测量测量30次得如下数据:次得如下数据:29,37,27,33,35,32,36,35,24,30,30,23,19,29,32,27,27,27,26,30,21,28,28,33,24,34,14,30,24,24,请,请计算平均值的绝对误差和相对误差。计算平均值的绝对误差和相对误差。
43、4.测量数据如上,请计算测量数据如上,请计算 、Me、极差、方极差、方差和变异系数差和变异系数。Z东华理工大学 张怀强预备知识预备知识习题习题3.3.已知本底计数率为已知本底计数率为10/min10/min,总的计数率为,总的计数率为160/min160/min,要求相对标准误差小于等于,要求相对标准误差小于等于1%1%,求,求测量本底计数及总计数的时间至少各为多少?测量本底计数及总计数的时间至少各为多少?4.4.分别测量分别测量1010分钟得计数率分钟得计数率1010cpm1010cpm,则计数,则计数率的绝对误差和相对误差各为多少?率的绝对误差和相对误差各为多少?%1,10,1610160
44、minbbannnmin111)116(01.010122minTmin22*161min8916116minabattTt%110*101011,1010101010,00tntnrNn解解:解解:东华理工大学 张怀强预备知识预备知识习题习题5.5.测量测量3030次得如下数据:次得如下数据:2929,3737,2727,3333,3535,3232,3636,3535,2424,3030,3030,2323,1919,2929,3232,2727,2727,2727,2626,3030,2121,2828,2828,3333,2424,3434,1414,3030,2424,2424,请计算平均值的绝对误,请计算平均值的绝对误差和相对误差。差和相对误差。解解:%43.397.0,27.28nknnnrn东华理工大学 张怀强预备知识预备知识习题习题6.6.测量数据如习题测量数据如习题5 5,请计算,请计算 、MeMe、极差、极差、方差和变异系数方差和变异系数。Z%6.18%100*58.27)(3012314375.2827.2830123012minmax301ZSBzzSZZdMezZiiii解解: