1、统计思维与典型案例的分析统计思维与典型案例的分析 东莞中学东莞中学 庞进发庞进发 统计是研究如何合理收集、整理、分 析数据的学科,它可以为人们制定决策提 供依据. 统计思维统计思维 统计思维是在抽取数据、从数据中 提取信息、论证结论可靠性等的过程中 表现出来的一种思维模式. 精品PPT 统计思维与确定性思维统计思维与确定性思维 1. 确定性思维结果的确定性 统计思维结果的随机性 2. 在学习统计的过程中,仍然要使用研 究确定性现象的数学手段进行抽象概括、 运算求解、推理论证等. 统计思维与典型案例统计思维与典型案例 1. 必修3中的典型案例:“一个著名 的案例”、“城市居民月用水量”、 “人体
2、的脂肪百分比与年龄之间的关 系” 2.选修23中的典型案例: “人的体 重与身高的关系”、“新药是否有 效”、“肺癌与吸烟有关吗” 、“水 果的分类” 回归分析回归分析 回归分析是对具有相关关系的两个变 量进行统计分析的一种常用方法. 函数关系是一种确定性关系,而 相关关系是一种非确定性关系. 从某大学中随机选取8名女大学 生,其身高和体重数据如表: 回归分析回归分析 案例案例1 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重 的回
3、归方程,并预报一名身高为172cm的女 大学生的体重. 回归分析回归分析 案例案例1 所以,对于身高172cm的女大学生, 由回归方程可以预报其体重为(kg) 712.85849. 0xy 316.60 y 作出散点图,得到回归方程是 假设检验假设检验 假设检验是利用样本信息,根据一 定概率,对总体参数或分布的某一假 设作出拒绝或保留的决断,即在论述H 不成立的前提下,有利于H的小概率事 件发生,就推断H发生. 假设检验假设检验 案例案例2 某地区的羊患某种病的概率是0.4,且每 只羊患病与否是彼此独立的,今研制一种新 的预防药,任选6只羊做实验,结果6只羊服 用此药后均未患病. 你认为这种药
4、是否有效? 假设检验假设检验 案例案例2 现假设“药无效”,则事件“6只羊都不 患病”发生的概率为 ,这是 一个小概率事件. 这个小概率事件的发生, 说明“药无效”的假设不合理,应该认为药 是有效的. 0467. 04 . 01 6 )( 独立性检验独立性检验 独立性检验是对两种分类变量之 间是否有关系进行检验 为调查吸烟是否对患肺癌有影响,某 肿瘤研究所随机地调查了9965人,得到如下结 果:(吸烟与患肺癌列联表) 独立性检验独立性检验 案例案例3 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否对患肺癌有
5、影响? 独立性检验独立性检验 案例案例3 由列联表可以粗略估计出:在不吸烟者中,有 0.54%患有肺癌;在吸烟者中,有2.28%患有 肺癌. 独立性检验独立性检验 案例案例3 现在想要推断的论述是 H0 :吸烟与患肺癌没有关系 吸烟与患肺癌列联表 abba cddc cadbdcba 不患肺癌 患肺癌 总计 不吸烟 吸烟 总计 独立性检验独立性检验 案例案例3 dc c ba a )()(bacdca 0bcad )()()( )( 2 2 dbcadcba bcadn K dcban 构造一个随机变量 其中 在“吸烟与患肺癌没有关系”成立的条件下可以估算 出 01. 0)635. 6( 2
6、KP05. 0)841. 3( 2 KP 10. 0)706. 2( 2 KP 聚类分析聚类分析 聚类分析是根据研究对象(个体) 的某些指标的数值特征,将对象进行分 类的方法. 聚类分析聚类分析 谱系聚类是一种逐次合并类的方法, 最后得到一个聚类的二叉树聚类图。其想 法是,对于 个观测,先计算其两两的距 离得到一个距离矩阵,然后把离得最近的 两个观测合并为一类,于是我们现在只剩 了 个类(每个单独的未合并的观测作为 一个类)。计算这 个类两两之间的距离, 找到离得最近的两个类将其合并,就只剩 下了 个类直到剩下两个类,把它 们合并为一个类为止。 n 1n 2n 如何对草莓、橙子、桃子、苹果、 梨等5种水果进行分类? 聚类分析聚类分析 案例案例4 可选取的指标:大小、形状、颜色、味 道、各种维生素的含量等 如每100g草莓、橙子、桃子、苹果和梨 中维生素C的含量依次约80mg,49mg, 10mg,5mg和4mg.