统计学期末复习课件.ppt

上传人(卖家):ziliao2023 文档编号:5701491 上传时间:2023-05-04 格式:PPT 页数:47 大小:168KB
下载 相关 举报
统计学期末复习课件.ppt_第1页
第1页 / 共47页
统计学期末复习课件.ppt_第2页
第2页 / 共47页
统计学期末复习课件.ppt_第3页
第3页 / 共47页
统计学期末复习课件.ppt_第4页
第4页 / 共47页
统计学期末复习课件.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

1、统计学期末复习统计学期末复习2010.11.10第第1章章 导论导论1.1 统计及其应用领域统计及其应用领域1.2 统计数据的类型统计数据的类型1.3 统计中的几个基本概念统计中的几个基本概念统计数据的分类统计数据的分类按计量层次按计量层次按收集方法按收集方法按时间状况按时间状况统计中的几个基本概念统计中的几个基本概念 总体和样本总体和样本 参数和统计量参数和统计量 变量变量第第2章章 数据的搜集数据的搜集1.数据的来源数据的来源2.搜集数据的调查方法搜集数据的调查方法3.搜集数据的实验方法搜集数据的实验方法4.数据的误差数据的误差5.数据的质量要求数据的质量要求抽样方法抽样方法简简单单随随机

2、机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式搜集数据的基本方法搜集数据的基本方法自自 填填式式面面 访访式式电电 话话式式调调 查查的的数数据据实实 验验的的数数据据搜搜 集集数数据据的的基基本本方方法法数据的误差数据的误差抽抽样样误误差差抽样框误差回答误差无回答误差调查员误差非非抽抽样样误误差差数数据据的的误误差差第第 3 章章 数据的图表展示数据的图表展示3.1 数据的预处理数据的预处理 3.2 品质数据的整理与显示品质数

3、据的整理与显示3.3 数值型数据的整理与显示数值型数据的整理与显示3.4 合理使用图表合理使用图表品质数据的整理与显示品质数据的整理与显示分类数据的整理与图示分类数据的整理与图示l可计算的统计量:可计算的统计量:频数、比例、百分比、比率频数、比例、百分比、比率l分类数据的图示:条形图、对比条形图、帕累托图、分类数据的图示:条形图、对比条形图、帕累托图、饼图饼图顺序数据的整理与图示顺序数据的整理与图示l可计算的统计量:可计算的统计量:累积频数、累积频率累积频数、累积频率l顺序数据的图示顺序数据的图示累计频数分布图、环形图累计频数分布图、环形图数值型数据的整理与展示数值型数据的整理与展示数据分组:

4、组距分组、单变量值分组数据分组:组距分组、单变量值分组数值型数据的图示:数值型数据的图示:分组数据分组数据直方图和折线图(直方图与条形图的区别)直方图和折线图(直方图与条形图的区别)未分组数据未分组数据茎叶图和箱线图茎叶图和箱线图时间序列数据时间序列数据线图线图多变量数据的图示多变量数据的图示 两个变量间的关系两个变量间的关系二维散点图二维散点图 三个变量间的关系三个变量间的关系气泡图气泡图 多变量数据多变量数据雷达图雷达图第第 4 章章 数据的概括性度量数据的概括性度量4.1 集中趋势的度量集中趋势的度量 4.2 离散程度的度量离散程度的度量4.3 偏态与峰态的度量偏态与峰态的度量数据分布特

5、征和描述统计量数据分布特征和描述统计量数据分布特征数据分布特征集中趋势集中趋势离散程度离散程度分布形状分布形状中位数中位数平均数平均数异众比率异众比率四分位差四分位差极差极差偏态系数偏态系数平均差平均差方差或标准差方差或标准差峰态系数峰态系数众数众数离散系数离散系数4.1 集中趋势的度量集中趋势的度量4.1.1 分类数据:众数分类数据:众数4.1.2 顺序数据:中位数和分位数顺序数据:中位数和分位数4.1.3 数值型数据:平均数数值型数据:平均数4.1.4 众数、中位数和平均数的比较众数、中位数和平均数的比较众数、中位数、平均数的特点和应用众数、中位数、平均数的特点和应用众数众数不受极端值影响

6、不受极端值影响具有不惟一性具有不惟一性数据分布偏斜程度较大且有明显峰值时应用数据分布偏斜程度较大且有明显峰值时应用中位数中位数不受极端值影响不受极端值影响数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用平均数平均数易受极端值影响易受极端值影响数学性质优良数学性质优良数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用4.2 离散程度的度量离散程度的度量4.2.1 分类数据:异众比率分类数据:异众比率4.2.2 顺序数据:四分位差顺序数据:四分位差4.2.3 数值型数据:方差和标准差数值型数据:方差和标准差4.2.4 相对离散程度:离散系数相对离散程度:离散系数4.3 偏态与峰态

7、的度量偏态与峰态的度量4.3.1 偏态及其测度:偏态系数偏态及其测度:偏态系数u偏态系数偏态系数=0为对称分布为对称分布u偏态系数偏态系数 0为右偏分布为右偏分布u偏态系数偏态系数 0为左偏分布为左偏分布4.3.2 峰态及其测度:峰态系数峰态及其测度:峰态系数u峰态系数峰态系数=0扁平峰度适中扁平峰度适中u峰态系数峰态系数0为尖峰分布为尖峰分布第第 6 章章 统计量及其抽样分布统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布6.7 关于样本方差的分布关

8、于样本方差的分布 样本均值的抽样分布样本均值的抽样分布1.在重复选取容量为在重复选取容量为n的样本时,由样本均值的样本时,由样本均值 的所有可能取值形成的相对频数分布的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.推断总体均值推断总体均值 的理论基础的理论基础4.当总体服从正态分布当总体服从正态分布N(,2)时,来自该总体的所有时,来自该总体的所有容量为容量为n的样本的均值的样本的均值 x也服从正态分布,也服从正态分布,x 的数的数学期望为学期望为,方差为,方差为2/n。即。即 xN(,2/n)中心极限定理中心极限定理l从均值为从均值为,方差为,方差为 2的一个任意总体

9、中抽取容量为的一个任意总体中抽取容量为n的样本,当的样本,当n充分大时,样本均值的抽样分布近似充分大时,样本均值的抽样分布近似服从均值为服从均值为、方差为、方差为2/n的正态分布。的正态分布。l当样本容量足够大时当样本容量足够大时(n 30),样本均值的抽样分,样本均值的抽样分布逐渐趋于正态分布。布逐渐趋于正态分布。样本比例的抽样分布样本比例的抽样分布l在重复选取容量为在重复选取容量为n的样本时,由样本比例的所有可能的样本时,由样本比例的所有可能取值形成的相对频数分布取值形成的相对频数分布l当样本容量很大时,样本比例的抽样分布可用正态分布当样本容量很大时,样本比例的抽样分布可用正态分布近似近似

10、。l样本比例的数学期望样本比例的数学期望l样本比例的方差样本比例的方差第第 7 章章 参数估计参数估计7.1 参数估计的一般问题参数估计的一般问题 7.2 一个总体参数的区间估计一个总体参数的区间估计7.4 样本量的确定样本量的确定参数估计的一般问题参数估计的一般问题l点估计:点估计:用样本的估计量的某个取值直接作为总体参用样本的估计量的某个取值直接作为总体参数的估计值数的估计值l区间估计:区间估计:在点估计的基础上,给出总体参数估计的在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而一个区间范围,该区间由样本统计量加减估计误差而得到。得到。l置信水平:将构造置

11、信区间的步骤重复很多次,置信置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。区间包含总体参数真值的次数所占的比例。l置信区间:置信区间:由样本统计量所构造的总体参数的估计区由样本统计量所构造的总体参数的估计区间称为置信区间。间称为置信区间。一个总体参数的区间估计一个总体参数的区间估计待估参数待估参数均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布总体均值的区间估计总体均值的区间估计l正态总体、正态总

12、体、已知,或非正态总体、大样本已知,或非正态总体、大样本l正态总体、正态总体、未知、小样本未知、小样本总体比例的区间估计总体比例的区间估计1.假定条件假定条件总体服从二项分布总体服从二项分布可以由正态分布来近似可以由正态分布来近似2.使用使用正态分布统计量正态分布统计量 z3.总体比例总体比例 在在1-置信水平下置信水平下的置信区间为的置信区间为样本量的确定样本量的确定l估计总体均值时样本量的确定估计总体均值时样本量的确定l估计总体比例时样本量的确定估计总体比例时样本量的确定第第 8 章章 假设检验假设检验8.1 假设检验的基本问题假设检验的基本问题 8.2 一个总体参数的检验一个总体参数的检

13、验8.4 假设检验中的其他问题假设检验中的其他问题假设检验的流程假设检验的流程l提出假设提出假设l确定适当的检验统计量确定适当的检验统计量l规定显著性水平规定显著性水平l计算检验统计量的值计算检验统计量的值l作出统计决策作出统计决策一个总体参数的检验一个总体参数的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差总体均值的检验总体均值的检验(检验统计量检验统计量)z 检验检验 总体总体 是否已知是否已知?样本量样本量nz 检验检验用样本标用

14、样本标准差准差S代替代替 t 检验检验总体均值的检验总体均值的检验(2 已知或已知或 2未知大样本未知大样本)1.假定条件假定条件总体服从正态分布总体服从正态分布若不服从正态分布若不服从正态分布,可用正态分布来近似可用正态分布来近似(n 30)2.使用使用Z-统计量统计量 2 已知:已知:2 未知:未知:一个总体比例检验一个总体比例检验1.假定条件假定条件有两类结果有两类结果总体服从二项分布总体服从二项分布可用正态分布来近似可用正态分布来近似2.比例检验的比例检验的 Z 统计量统计量原假设与备择假设的确定原假设与备择假设的确定l一般情况下,原假设为一般情况下,原假设为“原有的原有的”、“传统的

15、传统的”观点或观点或结论,被大多数人认可、接受的东西,是不容易否定的结论,被大多数人认可、接受的东西,是不容易否定的命题。命题。l备择假设为人们比较感兴趣的、新的、猜测的、需要验备择假设为人们比较感兴趣的、新的、猜测的、需要验证的命题。证的命题。l接受备择假设一定意味着原假设错误,而没有拒绝原假接受备择假设一定意味着原假设错误,而没有拒绝原假设并不能表明备择假设是错的,只是还没有足够的证据设并不能表明备择假设是错的,只是还没有足够的证据推翻原假设。推翻原假设。第第11章章 一元线性回归一元线性回归11.1 变量间关系的度量变量间关系的度量 11.2 一元线性回归一元线性回归11.3 利用回归方

16、程进行估计和预测利用回归方程进行估计和预测相关分析相关分析l变量之间是否存在关系?变量之间是否存在关系?l如果存在关系,它们之间是什么样的关系?如果存在关系,它们之间是什么样的关系?l变量之间的关系强度如何?变量之间的关系强度如何?l样本所反映的变量之间的关系能否代表总体变样本所反映的变量之间的关系能否代表总体变量之间的关系?量之间的关系?相关系数的性质相关系数的性质性质性质1:r 的取值范围是的取值范围是-1,1|r|=1,为完全相关为完全相关lr=1,为完全正相关,为完全正相关lr=-1,为完全负正相关,为完全负正相关 r=0,不存在不存在线性相关线性相关关系关系-1 r0,为负相关为负相

17、关0r 1,为正相关为正相关|r|越趋于越趋于1表示关系越强;表示关系越强;|r|越趋于越趋于0表示关系越弱表示关系越弱相关系数的性质相关系数的性质性质性质2:r具有对称性。即具有对称性。即x与与y之间的相关系数和之间的相关系数和y与与x之间之间 的相关系数相等,即的相关系数相等,即rxy=ryx性质性质3:r数值大小与数值大小与x和和y原点及尺度无关,即改变原点及尺度无关,即改变x和和y的的 数据原点及计量尺度,并不改变数据原点及计量尺度,并不改变r数值大小数值大小性质性质4:仅仅是:仅仅是x与与y之间线性关系的一个度量,它不能用之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着,

18、于描述非线性关系。这意为着,r=0只表示两变只表示两变 量之间不存在线性相关关系,并不说明变量之没量之间不存在线性相关关系,并不说明变量之没 有任何关系有任何关系性质性质5:r虽然是两个变量之间线性关系的一个度量,却不虽然是两个变量之间线性关系的一个度量,却不 一定意味着一定意味着x与与y一定有因果关系一定有因果关系相关系数的经验解释相关系数的经验解释1.|r|0.8时,可视为两个变量之间高度相关时,可视为两个变量之间高度相关2.0.5|r|0.8时,可视为中度相关时,可视为中度相关3.0.3|r|0.5时,视为低度相关时,视为低度相关4.|r|0.3时,说明两个变量之间的相关程度极弱,可视时

19、,说明两个变量之间的相关程度极弱,可视为不相关为不相关 上述解释必须建立在对相关系数的显著性进行检上述解释必须建立在对相关系数的显著性进行检验的基础之上验的基础之上回归分析回归分析1.从一组样本数据出发,确定变量之间的数学关系式从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特

20、定变量的取值,并给出这种预测或测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度控制的精确程度相关分析与回归分析的区别相关分析与回归分析的区别l在相关分析中,不必确定自变量和因变量;而在回归分在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断且只能从自变量去推测因变量,而不能从因变量去推断自变量。自变量。l相关分析不能指出变量间相互关系的具体形式;而回归相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,

21、它可分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。根据回归模型从已知量估计和预测未知量。l相关分析所涉及的变量一般都是随机变量,而回归分析相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机中因变量是随机的,自变量则作为研究时给定的非随机变量。变量。对对Excel 的回归结果进行分析的回归结果进行分析1.变量间关系的度量变量间关系的度量2.估计的回归方程估计的回归方程3.回归直线的拟合优度回归直线的拟合优度4.回归分析中的显著性检验回归分析中的显著性检验5.估计和预测估计和预测第第13章章 时间序列分析和预测时

22、间序列分析和预测13.1 时间序列及其分解时间序列及其分解 13.2 时间序列的描述性分析时间序列的描述性分析13.3 时间序列的预测程序时间序列的预测程序13.4 平稳序列的预测平稳序列的预测13.5 趋势型序列的预测趋势型序列的预测13.6 季节型序列的预测季节型序列的预测时间序列的分类与成分时间序列的分类与成分时间序列的分类:平稳序列和非平稳序列时间序列的分类:平稳序列和非平稳序列时间序列的成分:时间序列的成分:趋势性:持续向上或持续下降的状态或规律趋势性:持续向上或持续下降的状态或规律 季节性:时间序列在一年内重复出现的周期性波动季节性:时间序列在一年内重复出现的周期性波动 周期性:围绕长期趋势的一种波浪形或振荡式变动周期性:围绕长期趋势的一种波浪形或振荡式变动 随机性:除去趋势、周期性和季节性之后的偶然性随机性:除去趋势、周期性和季节性之后的偶然性波动波动 时间序列预测的程序时间序列预测的程序l确定时间序列所包含的成分确定时间序列所包含的成分l选择合适的预测方法选择合适的预测方法l对可能的预测方法进行评估,以确定最佳预测对可能的预测方法进行评估,以确定最佳预测方案方案l利用最佳预测方案进行预测利用最佳预测方案进行预测计算误差计算误差均方误差均方误差MSE平稳序列的预测平稳序列的预测l简单平均法简单平均法l移动平均法移动平均法l指数平滑法指数平滑法

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学期末复习课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|