1、5.1 走近数据分析走近数据分析(第第 1 课时课时) 【教学目标 通过公交车乘坐体验案例,了解数据分析的基本方法(对比分析 法和平均分析)和可视化表达的特点,感受数据分析的一般过程。 【教学重点】了解数据分析的基本方法(对比分析法和平均分 析);了解数据可视化表达的特点;了解分析报告的一般结构和表述 规范。 【教学难点】能够根据实际解决问题的需要,选择恰当的分析方 法,多角度进行分析,得出结论,并有效表达。 教学过程教学过程 案例一:某同学每天早上案例一:某同学每天早上 7:00 乘坐乘坐 27 路车去学校,路车去学校,17:00 左左 右回家,他觉得每天往返途中,公交车上并不拥挤。而妈妈每
2、天右回家,他觉得每天往返途中,公交车上并不拥挤。而妈妈每天 8: 00 乘坐乘坐 49 路车出发,路车出发,18:00 下班,她总是抱怨乘车者太多,请尝试下班,她总是抱怨乘车者太多,请尝试 进行数据分析。进行数据分析。 1、数据分析、数据分析是指用恰当的统计分析方法对收集来的大量数据进行 分析,提取有用信息,并形成结论的过程。 数据分析的一般过程数据分析的一般过程为根据分析的目标提出假设,然后收集有关 数据,选用恰当的分析方法进行分析,验证假设是否正确,继而得出 相应的结论。数据分析的基本方法有对比分析和平均分析。 2、对比分析、对比分析是指将两个或两个以上的数据进行比较,分析它们的 差异,从
3、而揭示这些数据所代表的事物发展变化情况和规律。对比分 为横向对比和纵向对比。 横向对比横向对比指的是类似的事物或者同类的事物之间进行比较; 纵向对比纵向对比指的是和相同事物的不同时期进行比较。 3、平均分析、平均分析就是运用计算平均值的方法,来反映总体在一定时 间、地点条件下某一数量特征的一般水平。平均分析和对比分析常结 合使用。 数据分析过程:数据分析过程: 步骤一:步骤一:依据活动 1 要求,提出假设: 。 步骤二:步骤二:27 路和 49 路公交线路的月平均分时段客流量如下表所示,表 中“6”表示 6:007:00,其他以此类推。请分析表中数据。来源:Zxxk.Com 步骤三:你的结论是
4、:。 参考答案: 学生的假设:(有多种) (1)假设 27 路公交车 7:00 平均客流量小于 49 路公交车 8:00 平均 客流量、27 路公交车 17:00 平均客流量小于 49 路公交车 18:00 平均 客流量; (2)27 路公交车平均客流量小于 49 路公交车; (3)27 路公交车在上下班高峰期平均客流量小于 49 路公交车。 由于假设不同,结论也可能不同。例如: (1)27 路公交车 7:00 平均客流量 130 人次小于 49 路公交车 8:00 平均客流量 211 人次、27 路公交车 17:00 平均客流量 120 人次小于 49 路公交车 18:00 平均客流量 12
5、3 人次。假设成立。 (2)27 路公交车在 6:00-19:00 平均客流量小于 49 路公交车,因此 假设不完全准确。 如何界定上下班高峰期,假设中必须加以说明,然后才能得出相 应结论。 4、数据可视化表达是、数据可视化表达是以图形、图像和动画等方式更加直观生动地 呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表 达方式。 图表是最常用的数据可视化表达方式之一。基本的图表类型有: 柱形图、饼图和折线图,利用一般的表格加工软件即可绘制。三种图 形化表示的特点及表示如下: 制作图表,分析两条公交线路的高峰期出现时间和特点(学生可分 组讨论)。来源:Z+xx+k.Com 提示:(图表
6、的制作过程:选定表格的数据区域插入图表 应用“图表向导”工具)来源:学。科。网 结论:结论:两条线路的高峰期基本相同,分别在 8:00-9:00 和 17: 00-19:00。早高峰 27 路公交车平均客流量小于 49 路公交车;晚高峰 两路公交车人次大致相当。 5、数据分析报告、数据分析报告是项目研究结果的展示,也是数据分析结论的有 效承载形式。通过报告不仅是把数据分析的起因、过程、结果及建议 完整的展现出来,更为决策者提供科学、严谨的决策依据。在数据分 析报告中,首先需要明确数据分析的目的和背景,阐述目前存在的问 题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的 思路、方法和模
7、型;最后需要重点呈现数据分析的过程、结论和建 议。 学生以小组为单位上交一份调查报告。学生以小组为单位上交一份调查报告。来源来源:学科网学科网 附:分析报告范例 信息时代的社会生活中,每天都会产生大量的数据,这些数据也 在改变着我们的生活。 课外作业:气温与出行课外作业:气温与出行 活动:气温和公交客流量的相关性 活动描述:某同学感觉天气越冷,乘公交车的人越少。该同学选取了所乘公交线路连续 8 周周二的 7:00-8:00 时段的公交客流量和平均气温数据,见下表。请帮他进行分析,探讨 气温和公交客流量是不是有一定的关联? 气温和客流量数据表 周次气温()客流量(人次) 1 来源:学科网 ZXX
8、K 20203 221199 318192 416191 515186 618174 711142 88157 首先首先需要根据研究问题,初步确定自变量和因变量 然后然后绘制散点图,初步判断自变量和因变量是否存在线性相关关系,建立回归模型, 并进行检验 最终最终确定回归模型进行预测。 图气温-客流量散点图 在散点图中,气温是自变量,客流量是因变量,观察这些点的分布规律,仿佛围绕着 一条直线上下波动,这条直线被称为趋势线。趋势线可以用回归方程 y=ax+b 描述。趋势 方程的拟合程度常用判定系数来判断。判定系数 R2 取值范围是0,1。R2 越接近于 1,表 明自变量和因变量之间相关性越强;R2 越接近于 0,表明两者之间几乎没有线性相关关 系。