1、4.数据的表达方法与分析1.数字修约规则3.可疑数据的取舍方法2.数据的统计特征与分布1.1数字修约规则数字修约规则 1、修约间隔、修约间隔 修约间隔是指确定修约修约间隔是指确定修约保留位数保留位数的一种方式。的一种方式。 修约间隔的数值一经确定,修约值即应为该数值修约间隔的数值一经确定,修约值即应为该数值的整数倍。的整数倍。 例如指定修约间隔为例如指定修约间隔为0.1,修约值即应在,修约值即应在0.1的整的整数倍中选取,相当于将数值修约到一位小数。数倍中选取,相当于将数值修约到一位小数。 又如指定修约间隔为又如指定修约间隔为100,修约值即应在,修约值即应在100的整的整数倍中选取,相当于将
2、数值修约到数倍中选取,相当于将数值修约到“百百”数位。数位。 2 2、 检测数据的修约规则检测数据的修约规则 (1)拟舍弃数字的最左一位数字小于拟舍弃数字的最左一位数字小于5时,则舍时,则舍去,即保留的各位数字不变。去,即保留的各位数字不变。例例l:将:将13.2476修约到一位小数,得修约到一位小数,得13.2。 例例2:将:将13.2476修约成两位有效位数,得修约成两位有效位数,得13。 (2 2)拟舍弃数字的最左一位数字大于)拟舍弃数字的最左一位数字大于5 5;或者是;或者是5 5,而且后面的数字并非全部为,而且后面的数字并非全部为0 0时,则进时,则进1 1,即保,即保留的末位数字加
3、留的末位数字加1 1。 例例l:将:将1167修约到修约到“百百”数位,得数位,得12102(特定时可写为(特定时可写为1200)。)。 例例2:将:将10.502修约到修约到“个个”数位,得数位,得11。(3)拟舍弃数字的最左一位数字为)拟舍弃数字的最左一位数字为5,而后面无数,而后面无数字或全部为字或全部为0时,若被保留的末位数字为时,若被保留的末位数字为奇数奇数(1,3,5,7,9)则进则进1,为偶数,为偶数(2,4,6,8,0)则舍弃则舍弃。 例例1:修约间隔为:修约间隔为0.1(或(或10-1)。)。 拟修约数值拟修约数值 修约值修约值 2.050 2.0 0.150 0.2(4)负
4、数修约时,先将它的绝对值按上述三条规)负数修约时,先将它的绝对值按上述三条规定进行修约,然后在修约值前面加上负号。定进行修约,然后在修约值前面加上负号。 例例1:将下列数字修约至:将下列数字修约至“十十”数位。数位。 拟修约数值拟修约数值 修约值修约值 -255 -2610(特定时可写为(特定时可写为-260) -245 -24l0(特定时可写为(特定时可写为-240) (5)0.5单位修约时,将拟修约数值乘以单位修约时,将拟修约数值乘以2,按指定,按指定数位依进舍规则修约,所得数值再除以数位依进舍规则修约,所得数值再除以2。 (6)0.2单位修约时,将拟修约数值乘以单位修约时,将拟修约数值乘
5、以5,按指定,按指定数位依进舍规则修约,所得数值再除以数位依进舍规则修约,所得数值再除以5。 (7)拟舍弃的数字并非单独的一个数字时,)拟舍弃的数字并非单独的一个数字时,不得不得对该数值连续进行修约对该数值连续进行修约,应按拟舍弃的数字中最,应按拟舍弃的数字中最左面的第一位数字的大小,按照上述各条一次修左面的第一位数字的大小,按照上述各条一次修约完成。约完成。 如如15.4546修约成整数时应为修约成整数时应为151.2 数据的统计特征与分布数据的统计特征与分布(一)数据的统计特征量(一)数据的统计特征量 1、算术平均值、算术平均值 算术平均值是表示一组数据集中位置最有用的统算术平均值是表示一
6、组数据集中位置最有用的统计特征量,经常用样本的算术平均值来代表总体的计特征量,经常用样本的算术平均值来代表总体的平均水平。平均水平。总体的算术平均值用总体的算术平均值用表示表示,样本的算样本的算术平均值则用术平均值则用 表示表示。如果。如果n个样本数据为个样本数据为x1、x2、 xi 、xn,则样本的算术平均值为:,则样本的算术平均值为: niinxnxxxnx1211)(1x2、加权平均值、加权平均值 若对同一物理量用不同的方法或对同一物理量用若对同一物理量用不同的方法或对同一物理量用不同的人去测定,测定的数据可能会受到某种因素不同的人去测定,测定的数据可能会受到某种因素的影响,这种影响的权
7、重必须给予考虑,一般采用的影响,这种影响的权重必须给予考虑,一般采用加权平均的方法进行计算。加权平均的方法进行计算。 表达方法:表达方法:1 12212nnnW xW xW xWWWW3、 中位数中位数 在一组数据在一组数据x1、x2、xi 、xn中,按其大小次中,按其大小次序排序,以排在正中间的一个数表示总体的平均序排序,以排在正中间的一个数表示总体的平均水平,称之为中位数(或称中值)。水平,称之为中位数(或称中值)。n为奇数时,为奇数时,正中间的数只有一个;正中间的数只有一个;n为偶数时,正中间的数为偶数时,正中间的数有两个,则取这两个数的平均值作为中位数,即:有两个,则取这两个数的平均值
8、作为中位数,即: 12122(1()2nnnxnxxxn为奇数)( 为偶数)4、 极差极差 在一组数据中最大值与最小值之差,称为极差,在一组数据中最大值与最小值之差,称为极差,记作记作R: R=xmax-xmin5、 标准偏差标准偏差 标准偏差有时也称标准偏差有时也称标准离差、标准差或称均方差标准离差、标准差或称均方差,是衡量样本数据波动性(离散程度)的指标。在质量是衡量样本数据波动性(离散程度)的指标。在质量检验中,总体的标准偏差检验中,总体的标准偏差一般不易求得。样本的标一般不易求得。样本的标准偏差准偏差S按下式计算:按下式计算:222212111ninixxxxxxxxSnn()() (
9、)()6、变异系数、变异系数 标准偏差是反映样本数据的标准偏差是反映样本数据的绝对波动状况绝对波动状况,当测,当测量较大的量值时,绝对误差一般较大;而测量较小量较大的量值时,绝对误差一般较大;而测量较小的量值时,绝对误差一般较小,因此,用相对波动的量值时,绝对误差一般较小,因此,用相对波动的大小,即变异系数更能反映样本数据的波动性。的大小,即变异系数更能反映样本数据的波动性。 变异系数用变异系数用Cv表示,是表示,是标准偏差标准偏差S与算术平均值与算术平均值的比值的比值,即:,即: %100 xSCV(二)统计数据的分布特征(二)统计数据的分布特征 1、直方图、直方图 即质量分布图,把收集到的
10、工序质量数据,用相即质量分布图,把收集到的工序质量数据,用相等的组距进行分组,按要求进行频数(每组中出现等的组距进行分组,按要求进行频数(每组中出现数据的个数)统计,再在直角坐标系中以组界为顺数据的个数)统计,再在直角坐标系中以组界为顺序、组距为宽度在横坐标上描点,以各组的频数为序、组距为宽度在横坐标上描点,以各组的频数为高度在纵坐标上描点,然后画成长方形连结图。高度在纵坐标上描点,然后画成长方形连结图。 2、正态分布、正态分布 正态分布的概率密度函数正态分布的概率密度函数22221xxef正态分布曲线的特点:正态分布曲线的特点:1、曲线以平均值为轴,左右两侧对称,即大于与小、曲线以平均值为轴
11、,左右两侧对称,即大于与小于平均值的概率相等;于平均值的概率相等;2、当、当x= ,曲线处于最高点,当,曲线处于最高点,当x向左右偏离时,向左右偏离时,曲线逐渐降低,整个曲线呈中间高,两边低;曲线逐渐降低,整个曲线呈中间高,两边低;3、在、在不变的情况下,曲线的形状不变,但曲线的不变的情况下,曲线的形状不变,但曲线的位置随着位置随着值变化二左右移动;值变化二左右移动;4、曲线与横坐标所围的面积等于、曲线与横坐标所围的面积等于1.即即121222dxex常见的双边置信区间的几个重要数据:常见的双边置信区间的几个重要数据:P-x+=68.26%P-2x+2=95.44%P-3x+3=99.73%P
12、-1.96x+1.96=95.00%双边置信区间统一写成:双边置信区间统一写成:-1-/2x+1-/2:显著性水平显著性水平1- :置信水平置信水平,即保证率即保证率1-/2:双边置信区间的正态分布临界值双边置信区间的正态分布临界值;单边置信区间单边置信区间:Px-= 84.13%Px-2= 97.72%Px-3= 99.87%Px-1.645= 95.00%置信区间可统一表示为置信区间可统一表示为:x r即认为即认为x与与y存在线性存在线性相关关系。相关关系。3、一元非线性回归分析、一元非线性回归分析 如果两个变量如果两个变量x和和y之间的关系是非线性关系,之间的关系是非线性关系,即某种曲线关系,则可即某种曲线关系,则可先将曲线方程变换为直线先将曲线方程变换为直线方程方程,然后按一元线性回归方法处理。,然后按一元线性回归方法处理。 先做相关图以确定非线性函数的类型,即找到先做相关图以确定非线性函数的类型,即找到一条拟合曲线,然后看能否用变量置换使之线性一条拟合曲线,然后看能否用变量置换使之线性化。化。