1、数据采集与整理【课程标准】l 通过典型的应用实例,了解数据采集的基本方法。l 根据任务需求,选用恰当的软件工具或平台处理数据,理解对数据进行保护的意义。【教学目标】l 根据不同的采集需求,选择适当的采集工具和方法。(数字化学习与创新)l 按照问题解决方案,使用Python 语言编写的爬虫程序进行数据采集,了解网络爬虫的功能和工作原理。(计算思维)【学业要求】了解数据采集的基本方法,能够利用软件工具或平台对数据进行整理、组织,并能通过技术方法对数据进行保护。【学情分析】通过前面的学习,学生已经了解了数据及其相关概念,知道数据的重要性,已经掌握了算法描述和程序设计实现的基本方法,具有使用程序解决实
2、际问题的意识。学生对通过网络收集数据的方法比较熟悉,也易于接受使用移动应用程序收集数据,但对使用工具收集数据和使用爬虫程序获取数据没有经验,须重点讲解。【教学重点】数据采集的基本方法。【教学难点】使用网络爬虫采集数据的原理和方法。【教学方法】教学方法:问题导学为主,演示讲解为辅。学习方法:小组合作学习,以4人为一组,1人为组长,组长对数据采集任务进行分工、合成和展示。教学策略:以“为什么要南水北调”为问题切入点,引导学生思考,若想更准确地了解我国水资源情况,须研究哪些数据,即明确数据需求;学生已熟知网络查询是比较快捷、方便的方法,所以自然选择网络查询,即确定数据来源;通过实践发现查询速度较慢,
3、教师及时引入网络爬虫程序快速解决问题,即在数据采集过程中优化数据采集方法;再通过分析表中数据,拓展学习使用工具采集数据的方法,为以后学生能够根据实际情况选择最佳采集方法奠定基础,从而完成本节课的教学任务。【教学过程】教学环节教学内容学生活动设计意图情境引入展示我国南水北调工程的图片。教师提问:我国确定要进行这一伟大工程的依据是什么呢观看图片思考问题回答问题引入学习主题实例初探(明确数据需求)1利用互联网查找我国水资源分布的图文资料。教师提问:分析资料,可以看出我国水资源最缺乏的地区是西北的新疆、青海和甘肃的部分地区,但水资源压力最大的是华北的北京、天津和河北等地区,这是为什么呢?2组织学生展示
4、、交流结果查阅资料交流讨论让学生根据实际问题归纳数据需求深入引导(确定数据来源)1体验探索:我国水资源基本呈现南多北少的特点,有几条重要河流(如黄河、长江、珠江、松花江等)分布在不同区域。为了更具体地了解各地区情况,一起查询重要河流的水资源数据。展示教科书第91页表 321“黄河流域水资源数据汇总表”。让学生以小组为单位,参照表321,查询其他流域的水资源情况,并填写教科书中第91页的表322。2组织学生上传、展示数据。3组织学生讨论如何快速、准确地获取所需要的数据观察数据查询资料填写表格展示结果让学生根据实际情况确定采集数据的途径精讲点拨(选择采集方法)1教师提问:为了全面分析我国水资源情况
5、,需要分析不同地区多年的数据,如何既准确又快速地得到这些数据呢?2师生分析:通过观察发现,网页中的数据存储在表格中,根据HTML语言的特点,这些数据都存在于相同的表单元素中,借助这一特点我们就可以使用Python语言编写程序获取所需要的数据,即使用网络爬虫程序获取数据。教师展示使用爬虫程序获取的数据,并分析其特点。3体验网络爬虫采集数据:学生完成实践活动“通过网络获取水资源数据”。4了解传感器采集数据:阅读教科书第93页关于远程智能抄表系统的内容,了解其工作原理。5体验手机传感器采集数据:学生以小组为单位进行实验活动,体验移动终端中的传感器及其应用,并填写相关表格思考回答分析归纳实践活动阅读教科书小组活动了解人工网络查询、网络爬虫搜索、工具检测等采集方法的特点和适用情况实践应用(实施数据采集)布置任务:1获取2018年长江(黄河、珠江、松花江)流域水资源质量汇总表。2获取近年来全国各地区用水量数据。积极巡视,指导学生根据任务选择合适的采集方法,解决学生个别问题,协调好各组的分工合作完成任务实践应用,巩固新知识,同时为下节课准备素材交流评价组织学生以小组为单位,展示成果,并对其他组的作品进行评价。根据评价修改完善本组作品并提交展示评价完善作品提交作品互相交流,取长补短总结梳理师生共同总结数据采集的方法传感器采集、网络获取等