1、5.1 走近走近数据分析数据分析(第第1课时课时) 【教学目标【教学目标 通过公交车乘坐体验案例,了解数据分析的基本方法 (对比分析法和平均分析)和可视化表达的特点,感 受数据分析的一般过程。 【教学重点】【教学重点】 了解数据分析的基本方法(对比分析法和平均分析); 了解数据可视化表达的特点;了解分析报告的一般结 构和表述规范。 【教学难点】【教学难点】 能够根据实际解决问题的需要,选择恰当的分析方法, 多角度进行分析,得出结论,并有效表达。 案例一案例一 某同学每天早上某同学每天早上7:00乘坐乘坐27路车去学校,路车去学校,17: 00左右回家,他觉得每天往返途中,公交车上并左右回家,他
2、觉得每天往返途中,公交车上并 不拥挤。而妈妈每天不拥挤。而妈妈每天8:00乘坐乘坐49路车出发,路车出发,18: 00下班,她总是抱怨乘车者太多,请尝试进行数下班,她总是抱怨乘车者太多,请尝试进行数 据分析。据分析。 1、数据分析、数据分析 数据分析数据分析是指用恰当的统计分析方法对收 集来的大量数据进行分析,提取有用信息, 并形成结论的过程 数据分析的一般过程数据分析的一般过程为根据分析的目标提出 假设,然后收集有关数据,选用恰当的分析 方法进行分析,验证假设是否正确,继而得 出相应的结论。数据分析的基本方法有对比 分析和平均分析。 2、对比分析、对比分析 对比分析对比分析是指将两个或两个以
3、上的数据进 行比较,分析它们的差异,从而揭示这些 数据所代表的事物发展变化情况和规律。 对比分为横向对比和纵向对比。 横向对比横向对比指的是类似的事物或者同类的事 物之间进行比较; 纵向对比纵向对比指的是和相同事物的不同时期进 行比较。 3、平均分析、平均分析 平均分析平均分析就是运用计算平均值的方法,来 反映总体在一定时间、地点条件下某一数 量特征的一般水平。平均分析和对比分析 常结合使用。 数据分析过程数据分析过程: 步骤一:步骤一:依据活动1要求,提出假 设: 。 步骤二:步骤二:27路和49路公交线路的月平均分时段客流量如下表 所示,表中“6”表示6:007:00,其他以此类推。请分
4、析表中数据。 你你的结论是的结论是: 参考答案:参考答案: 学生的假设:(有多种) (1)假设27路公交车7:00平均客流量小于49路公交车8: 00平均客流量、27路公交车17:00平均客流量小于49路公 交车18:00平均客流量; (2)27路公交车平均客流量小于49路公交车; (3)27路公交车在上下班高峰期平均客流量小于49路公交 车。 由于假设不同,结论也可能不同。例如: (1)27路公交车7:00平均客流量130人次小于49路公交车 8:00平均客流量211人次、27路公交车17:00平均客流量 120人次小于49路公交车18:00平均客流量123人次。假设 成立。 (2)27路公
5、交车在6:00-19:00平均客流量小于49路公交 车,因此假设不完全准确。 如何界定上下班高峰期,假设中必须加以说明,然后才能得 出相应结论。 4、数据可视化表达、数据可视化表达 数据可视化表达是数据可视化表达是以图形、图像和动画等方 式更加直观生动地呈现数据及数据分析结果, 揭示数据之间的关系、趋势和规律等的表达 方式。 图表是最常用的数据可视化表达方式之一。 基本的图表类型有:柱形图、饼图和折线图, 利用一般的表格加工软件即可绘制。三种图 形化表示的特点及表示如下: 制作图表,分析两条公交线路的高峰期制作图表,分析两条公交线路的高峰期 出现时间和特点(学生可分组讨论)出现时间和特点(学生
6、可分组讨论) 提示:(图表的制作过程:选定表格的数据区 域插入图表应用“图表向导”工具) 图表如下:图表如下: 结论:结论: 两条线路的高峰期基本两条线路的高峰期基本 相同,分别在相同,分别在8:00-9: 00和和17:00-19:00。 早高峰早高峰27路公交车平均路公交车平均 客流量小于客流量小于49路公交车;路公交车; 晚高峰两路公交车人次晚高峰两路公交车人次 大致相当。大致相当。 5、数据分析报告、数据分析报告 数据分析报告数据分析报告是项目研究结果的展示,也是数据 分析结论的有效承载形式。通过报告不仅是把数 据分析的起因、过程、结果及建议完整的展现出 来,更为决策者提供科学、严谨的
7、决策依据。在 数据分析报告中,首先需要明确数据分析的目的 和背景,阐述目前存在的问题及通过分析希望解 决的问题;其次需要描述数据来源和数据分析的 思路、方法和模型;最后需要重点呈现数据分析 的过程、结论和建议。 学生以小组为单位上交一份调查报告学生以小组为单位上交一份调查报告。附:分析报告范例附:分析报告范例 信息时代的社会生信息时代的社会生 活中,每天都会产活中,每天都会产 生大量的数据,这生大量的数据,这 些数据也在改变着些数据也在改变着 我们的生活。我们的生活。 课外作业:气温与课外作业:气温与出行出行 活动:气温和公交客流量的相关性 活动描述:某同学感觉天气越冷,乘公交车的人越少。该同
8、学选取了所乘公 交线路连续8周周二的7:00-8:00时段的公交客流量和平均气温数据,见下表。 请帮他进行分析,探讨气温和公交客流量是不是有一定的关联? 周次周次气温(气温( ) )客流量(人次)客流量(人次) 120203 221199 318192 416191 515186 618174 711142 88157 气气 温温 和和 客客 流流 量量 数数 据据 表表 首先首先需要根据研究问题,初步确定自变量和因变量 然后然后绘制散点图,初步判断自变量和因变量是否存在线性相关关系,建立 回归模型,并进行检验 最终最终确定回归模型进行预测。 图气温图气温-客流量散点图客流量散点图 在散点图中,气温是自变量,客流量是因变量,观察这些点的分布规律,仿佛 围绕着一条直线上下波动,这条直线被称为趋势线。趋势线可以用回归方程 y=ax+b描述。趋势方程的拟合程度常用判定系数来判断。判定系数R2取值范围 是0,1。R2越接近于1,表明自变量和因变量之间相关性越强;R2越接近于0, 表明两者之间几乎没有线性相关关系。 参考答案:参考答案: 再见!