1、1.收集数据收集数据抽样方法抽样方法2.分析数据分析数据统计表、数据的数统计表、数据的数字特征及用样本估计总体字特征及用样本估计总体统计的基本知识框架统计的基本知识框架1一、抽样方法一、抽样方法2一、抽样方法一、抽样方法3二、数据的数字特征及用样本估计总体二、数据的数字特征及用样本估计总体1用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征(1)众数、中位数)众数、中位数在一组数据中在一组数据中出现次数最多出现次数最多的数据叫做的数据叫做众数众数;将一组数据按照从大到小(或从小到大)排列,将一组数据按照从大到小(或从小到大)排列,处在处在中间位置上的一个数据(或中间两位数据的
2、中间位置上的一个数据(或中间两位数据的平均数平均数)叫做这组数据的中位数;)叫做这组数据的中位数;(2)平均数与方差平均数与方差123nxxxxxn22222123()()()()=nxxxxxxxxSn4二、数据的数字特征及用样本估计总体二、数据的数字特征及用样本估计总体12312322222123:,()()()()=nnnnxx xxxxxxxxnxxxxxxxxSn常用结论:有一组数据的平均值为方差为123:,nnaxbaxb axb axbaxb构造新数据1222221222()()()()()()=nnaxbaxbaxbxaxbnaxbxaxbxaxbxSna S的平均值为方差为5
3、2.频率分布直方图、折线图与茎叶图频率分布直方图、折线图与茎叶图 二、数据的数字特征及用样本估计总体二、数据的数字特征及用样本估计总体样本中所有数据(或数据组)的频率和样本容量样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。所有数据(或数据组)的比,就是该数据的频率。所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。率分布直方图、折线图、茎叶图来表示。频率分布直方图:具体做法如下:频率分布直方图:具体做法如下:(1)求极差(即一组数据中最大值与最小值的差);)求极差(即一组数据中最大值与
4、最小值的差);(2)决定组距与组数;()决定组距与组数;(3)将数据分组;)将数据分组;(4)列频率分布表;)列频率分布表;(5)画频率分布直方图)画频率分布直方图频率分布直方图中频率分布直方图中小长方形的面积小长方形的面积=组距组距 =频率频率 组距频率6二、样本估计总体1.频率分布直方图、频率分布折线图、总体密度曲线(1)频率=纵坐标组距=nN(2)频率之和为1例27变量的相关性变量的相关性与统计案例与统计案例8三、线性相关性与最小二乘法三、线性相关性与最小二乘法9abxyxbyaxnxyxnyxbniiniii2121niixnx11三、线性相关性与最小二乘法三、线性相关性与最小二乘法1
5、0三、线性相关性与最小二乘法三、线性相关性与最小二乘法11三、两个变量的线性相关1.正相关、负相关、回归直线正相关、负相关、回归直线axby(i)过过(ii)X每增加一个单位,每增加一个单位,y平均(约)增加(减少)平均(约)增加(减少)个单位个单位(iii)当当x=x0时,时,y约为约为x y(,)b0bxa3.相关系数相关系数r(i)衡量两个变量间的线性相关关系衡量两个变量间的线性相关关系(ii)r0时,正相关,时,正相关,r6.635时,有时,有99%的把握说事件的把握说事件A与与B有关;有关;2.当当k3.841时,有时,有95%的把握说事件的把握说事件A与与B有关;有关;四、统计案例
6、四、统计案例独立性检验独立性检验卡方检验卡方检验()2 2 列联表)()()()(2dbcadcbabcadnK214统统计计抽样:抽样:简单随机抽样,简单随机抽样,统计图:统计图:频率分布直方图,折线图,茎叶图频率分布直方图,折线图,茎叶图数字特征:数字特征:平均数、众数、中位数、平均数、众数、中位数、方差、标准差、极差方差、标准差、极差独立性检验:独立性检验:回归分析:回归分析:分层抽样分层抽样223.841,95%6.635,99%KK把握相关;把握相关,);ybxax yxxmybma定过(增加一个单位,y增加b个单位;时,大约为nPN22列联表列联表相关性检验:相关性检验:|r|1,|r|1,|r|1,|r|1,线性相关越强线性相关越强1516