5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx

上传人(卖家):Q123 文档编号:4901733 上传时间:2023-01-23 格式:PPTX 页数:24 大小:4.91MB
下载 相关 举报
5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx_第1页
第1页 / 共24页
5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx_第2页
第2页 / 共24页
5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx_第3页
第3页 / 共24页
5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx_第4页
第4页 / 共24页
5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、第2单元 编程计算第1单元 初识数据与计算第3单元 认识数据第4单元 计算与问题解决第5单元 数据分析与人工智能信息技术信息技术(必修(必修1 1)5.1 5.1 走近数据分析走近数据分析学习目标 了解数据分析的几种常用方法。了解数据分析的几种常用方法。体验对比分析和平均分析的体验对比分析和平均分析的般分析过程。般分析过程。了解大数据的含义,认识大数据分析在信息社会的重了解大数据的含义,认识大数据分析在信息社会的重要作用。要作用。随着我国经济的快速发展和城市化进程随着我国经济的快速发展和城市化进程的加快,城市人口和机动车辆日益增多,城的加快,城市人口和机动车辆日益增多,城市交通拥堵现象日益严重

2、。科学地发展和管市交通拥堵现象日益严重。科学地发展和管理公共交通是解决问题的有效途径之一。理公共交通是解决问题的有效途径之一。如何合理安排公交车辆的发车频率,如何合理安排公交车辆的发车频率,方便乘车人选择交通线路等,都可以通方便乘车人选择交通线路等,都可以通过数据分析来实现。本节我们将围绕过数据分析来实现。本节我们将围绕 “感受智能公交感受智能公交”项目展开学习。项目展开学习。新课导入 某同学每天某同学每天7 7:0000乘坐乘坐2727路车去学校,路车去学校,1717:0000放学回家,感觉往返途中车,不拥放学回家,感觉往返途中车,不拥挤;妈妈挤;妈妈8 8:0000乘坐乘坐4949路车上班

3、,路车上班,1818:0000下班,总是抱怨乘车人太多。你觉得是什么下班,总是抱怨乘车人太多。你觉得是什么原因?可以通过数据验证你的想法吗?原因?可以通过数据验证你的想法吗?任务一 体验公交出行 师生讨论,提出假设假设假设1 1:可能可能4949路车路车8 8:0000与与1818:0000左右左右客流量比客流量比2727路路7 7:0000与与1717:0000客流量客流量大。大。假设假设2 2:可能可能8 8:0000与与1818:0000刚好是刚好是4949路车路车的高峰期,而的高峰期,而7 7:0000与与1717:0000不是不是2727路路车的高峰期车的高峰期。假设假设3 3:可能

4、某一段时间内可能某一段时间内4949路车的平均客路车的平均客流量要更大。流量要更大。27路与49路公交线路客流量表时间段时间段27路49路时间段时间段27路49路6:00-7:006:00-7:00456115:00-16:0015:00-16:0058987:00-8:007:00-8:0012017016:00-17:0016:00-17:00701028:00-9:008:00-9:0016021117:00-18:0017:00-18:001201259:00-10:009:00-10:0014314918:00-19:0018:00-19:0012112310:00-11:0010:

5、00-11:005312219:00-20:0019:00-20:00655711:00-12:0011:00-12:00729920:00-21:0020:00-21:00503012:00-13:0012:00-13:00596521:00-22:0021:00-22:00302513:00-14:0013:00-14:005810022:00-23:0022:00-23:00161314:00-15:0014:00-15:005696假设1:哪些时间段,哪些时间段,4949路车比路车比2727路车客流量更大路车客流量更大呢?你准备如何进行比较?呢?你准备如何进行比较?27路与49路公交线

6、路客流量表时间段时间段27路49路时间段时间段27路49路6:00-7:006:00-7:00456115:00-16:0015:00-16:0058987:00-8:007:00-8:0012017016:00-17:0016:00-17:00701028:00-9:008:00-9:0016021117:00-18:0017:00-18:001201259:00-10:009:00-10:0014314918:00-19:0018:00-19:0012112310:00-11:0010:00-11:005312219:00-20:0019:00-20:00655711:00-12:0011

7、:00-12:00729920:00-21:0020:00-21:00503012:00-13:0012:00-13:00596521:00-22:0021:00-22:00302513:00-14:0013:00-14:005810022:00-23:0022:00-23:00161314:00-15:0014:00-15:005696 对比分析中的对比分析中的横向对比分析横向对比分析是指在类似的或是指在类似的或同类的事物之间进行比较,从而揭示两类事物之同类的事物之间进行比较,从而揭示两类事物之间的关系。间的关系。蛋白质排序蛋白质排序 对比数据,分析方法0501001502002506:00

8、-7:007:00-8:008:00-9:009:00-10:0010:00-11:0011:00-12:0012:00-13:0013:00-14:0014:00-15:0015:00-16:0016:00-17:0017:00-18:0018:00-19:0019-00-20:00客流量客流量21路54路问题问题1 1:你知道数据如何处理能更直观看出吗?你知道数据如何处理能更直观看出吗?以图形、图像和动画等方式可以更为直以图形、图像和动画等方式可以更为直观、生动地呈现数据以及分析数据的结果,观、生动地呈现数据以及分析数据的结果,揭示数据之间的关系、趋势和规律等,这种揭示数据之间的关系、趋势

9、和规律等,这种表达方式被称为表达方式被称为数据可视化表达数据可视化表达。图表是最。图表是最常用的数据可视化表达方式之一。常用的数据可视化表达方式之一。02468101214蛋白质(克)脂肪(克)碳水化合物(克)苹果 水果类西红柿 蔬菜冬瓜 蔬菜大米 谷类鸡肉 肉类鲫鱼 肉类假设假设2 2:如果你想知道如果你想知道4949路车和路车和2727路车的高峰路车的高峰期,你会对哪些数据进行比较呢?期,你会对哪些数据进行比较呢?对同一事物不同时间客流量进行对比对同一事物不同时间客流量进行对比分析,这种分析方式被称为分析,这种分析方式被称为纵向对比分析纵向对比分析。27路与49路公交线路客流量表时间段时间

10、段27路49路时间段时间段27路49路6:00-7:006:00-7:00456115:00-16:0015:00-16:0058987:00-8:007:00-8:0012017016:00-17:0016:00-17:00701028:00-9:008:00-9:0016021117:00-18:0017:00-18:001201259:00-10:009:00-10:0014314918:00-19:0018:00-19:0012112310:00-11:0010:00-11:005312219:00-20:0019:00-20:00655711:00-12:0011:00-12:007

11、29920:00-21:0020:00-21:00503012:00-13:0012:00-13:00596521:00-22:0021:00-22:00302513:00-14:0013:00-14:005810022:00-23:0022:00-23:00161314:00-15:0014:00-15:005696 对比数据,分析方法0501001502006:00-7:007:00-8:008:00-9:009:00-10:0010:00-11:00-12:00-13:00-14:00-15:00-16:00-17:00-18:00-19-00-客流量客流量21路问题:问题:采用什么类型

12、的数据可视化方式展现采用什么类型的数据可视化方式展现4949路车与路车与2727路车的高峰期,比较好?路车的高峰期,比较好?柱形图柱形图能清楚表示每个项目的具体数能清楚表示每个项目的具体数目,体现不同项目之间的比较;目,体现不同项目之间的比较;饼图饼图反映各部分在总体中所占的比例;反映各部分在总体中所占的比例;折线图折线图反应事物随时间变化的情况。反应事物随时间变化的情况。例如比较不同线路的平均客流量。例如比较不同线路的平均客流量。通过求得的平均数来代表车辆在一定时通过求得的平均数来代表车辆在一定时间内的一般客流量水平,这样比较平均数,间内的一般客流量水平,这样比较平均数,就可以知道那条线路客

13、流量更大,这种分析就可以知道那条线路客流量更大,这种分析方式称为方式称为平均分析法。平均分析法。数据计算,平均分析假设假设3 3:可能某段时间可能某段时间4949路车的平均客流量大于路车的平均客流量大于2727路,那么同学们认为,这个平均客流量路,那么同学们认为,这个平均客流量如何求解比较合适?怎么能更直观表现出如何求解比较合适?怎么能更直观表现出来?来?27路与49路公交线路客流量表时间段时间段27路49路时间段时间段27路49路6:00-7:006:00-7:00456115:00-16:0015:00-16:0058987:00-8:007:00-8:0012017016:00-17:0

14、016:00-17:00701028:00-9:008:00-9:0016021117:00-18:0017:00-18:001201259:00-10:009:00-10:0014314918:00-19:0018:00-19:0012112310:00-11:0010:00-11:005312219:00-20:0019:00-20:00655711:00-12:0011:00-12:00729920:00-21:0020:00-21:00503012:00-13:0012:00-13:00596521:00-22:0021:00-22:00302513:00-14:0013:00-14:

15、005810022:00-23:0022:00-23:00161314:00-15:0014:00-15:0056960501001502002506:00-7:007:00-8:008:00-9:009:00-10:0010:00-11:0011:00-12:0012:00-13:0013:00-14:0014:00-15:0015:00-16:0016:00-17:0017:00-18:0018:00-19:0019-00-20:00客流量客流量21路54路 善于学习,更善于总结 你认为横向对比分析法与纵向对比分析法有什么区别?你认为横向对比分析法与纵向对比分析法有什么区别?与平均分析法呢

16、?与平均分析法呢?02468101214蛋白质(克)脂肪(克)碳水化合物(克)苹果 水果类西红柿 蔬菜冬瓜 蔬菜大米 谷类鸡肉 肉类鲫鱼 肉类数据分析方法数据分析方法应用实例应用实例适用范围适用范围作用作用横行对比分析横行对比分析纵向对比分析纵向对比分析平均分析平均分析 部分食物中营养营养成分对比表 一天中气温的变化情况不同食物中蛋白质含量的对比;不同食物中蛋白质含量的对比;4949路车与路车与2727路车客流量的对比路车客流量的对比同类事物同类事物比较事物间大小、比较事物间大小、数量关系数量关系一天气温变化情况;一天气温变化情况;4949路车客流高峰期路车客流高峰期单一事物单一事物展现变化过

17、程展现变化过程同类事物同类事物水果类食物中蛋白质含量的平水果类食物中蛋白质含量的平均值;国家人口的平均寿命均值;国家人口的平均寿命衡量平均水平衡量平均水平数据分析报告 数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。通过数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。通过报告不仅把数据分析的起因、过程、结果及建议完整地展现出来,还可以为决策者提报告不仅把数据分析的起因、过程、结果及建议完整地展现出来,还可以为决策者提供科学、严谨的决策依据。例如供科学、严谨的决策依据。例如 在数据分析报告中,首先要明确在数据分析报告中,首先要明确数据分析的目的和背景,阐述目前

18、存数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;在的问题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的其次需要描述数据来源和数据分析的思路、方法和模型;最后要重点呈现思路、方法和模型;最后要重点呈现数据分析的过程、结论和建议。数据分析的过程、结论和建议。活动1 我在哪里 假如来到一个陌生的地方,需要知道自己所处的具体位置,手机里的地图软件可以假如来到一个陌生的地方,需要知道自己所处的具体位置,手机里的地图软件可以很方便地帮助你定位、计算并推荐去目的地的路线。很方便地帮助你定位、计算并推荐去目的地的路线。打开地图软件,屏幕上的蓝色标记打开地图软件,屏幕上的蓝色标记

19、就是使用者所处的位置就是使用者所处的位置 很多地图软件还提供了很多地图软件还提供了“全景全景”模式。选择模式。选择“查查看全景看全景”可以展示实地拍可以展示实地拍摄的摄的“全景全景”照片,照片,如如图所示。在照片上滑动手图所示。在照片上滑动手指,可以多角度查看场景。指,可以多角度查看场景。点击移动方向箭头,场景点击移动方向箭头,场景则根据位置改变。则根据位置改变。任务二 体验实时公交 让我们估算一下全景模式下照片数据的让我们估算一下全景模式下照片数据的“体量体量”。根据全景照片的拍摄规则,一个拍摄点。根据全景照片的拍摄规则,一个拍摄点需要多角度拍摄数张照片进行拼接。如果一个拍摄点需要拍摄需要多

20、角度拍摄数张照片进行拼接。如果一个拍摄点需要拍摄8 8张照片,每张照片的大小约为张照片,每张照片的大小约为4MB,4MB,1 1个拍摄点的照片数据量是多少?考虑到地图的连续性,如果相邻拍摄点间隔为个拍摄点的照片数据量是多少?考虑到地图的连续性,如果相邻拍摄点间隔为1616米,米,那么一条那么一条长长1 1千米的街道需要多少张照片?数据量是多少?如果是一个城市呢?千米的街道需要多少张照片?数据量是多少?如果是一个城市呢?一个拍摄点需要拍摄一个拍摄点需要拍摄8 8张照片张照片每张照片的大小约为每张照片的大小约为4MB4MB8x4=32(MB)每16米有一个景点10001662(个)62x32=19

21、84(MB)想一想,一个城市有多少个街道?想一想,一个城市有多少个街道?大数据 大数据是大数据是以容量大、类型多、存取速度快、应用价值高为主要以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新值、提升新能力的新一一代信息技术和服务业态。代信息技术和服务业态。大数据的意义大数据的意义在于,我们有可能从如此庞杂的数据中挖掘出有在于,我们有可能从如此庞杂的数

22、据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。领域,为社会发展服务。活动2 公交车距离我多远 在地图软件中输入起点和终点,点击搜索按钮就可以获得所需的公交方案。但是在公在地图软件中输入起点和终点,点击搜索按钮就可以获得所需的公交方案。但是在公交站台等车,久等不来总令人焦急。实时公交信息查询软件则可以实时反馈公交车辆的运交站台等车,久等不来总令人焦急。实时公交信息查询软件则可以实时反馈公交车辆的运行信息,提升乘客的出行效率,如图所示。行信息,提升乘客的出行效率,如图所示。“体验公交出行体验公交

23、出行”案例与案例与“实时公交实时公交”案例对比,同学们认为,要做到实时得出公交案例对比,同学们认为,要做到实时得出公交信息,百度地图需要获取与分析那些类型的数据信息?信息,百度地图需要获取与分析那些类型的数据信息?公交车的位置信息数据、公交线路数据、站点停留数据等等。公交车的位置信息数据、公交线路数据、站点停留数据等等。大数据分析的应用 面对海量的数据,为了面对海量的数据,为了搜索、处理、分析、归纳和总结其深层次的搜索、处理、分析、归纳和总结其深层次的规律规律,大数据分析应运而生。,大数据分析应运而生。大数据分析大数据分析是指对规模巨大的数据进行分是指对规模巨大的数据进行分析。它的应用日益丰富

24、,例如实时公交系统根据用户当前位置,迅速定析。它的应用日益丰富,例如实时公交系统根据用户当前位置,迅速定位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实时位置。用户和车辆的位置信息通常通过卫星定位系统、时位置。用户和车辆的位置信息通常通过卫星定位系统、Wi-FiWi-Fi热点和热点和基站的位置确定。基站的位置确定。(软件界面)(软件界面)(公交查询)(公交查询)(线路查询)(线路查询)(时间及距离

25、查询)(时间及距离查询)实时公交信息查询软件可以实时反馈公交车辆的运行信息,提升乘客的出行效率。实时公交信息查询软件可以实时反馈公交车辆的运行信息,提升乘客的出行效率。体验一款实时公交软件,输入起点和终点,获取所需的公交方案,并了解公交车和你体验一款实时公交软件,输入起点和终点,获取所需的公交方案,并了解公交车和你之间的距离并填写下表。(高德实时公交)之间的距离并填写下表。(高德实时公交)实时公交信息查询软件使用体验实时公交信息查询软件使用体验序号序号体验并思考问题体验并思考问题结果结果1 1查看该软件为用户提供了哪些实用功能?查看该软件为用户提供了哪些实用功能?路线、时间及距离查询路线、时间

26、及距离查询2 2如果有条件,乘公交车出行时使用该软件,并回答如果有条件,乘公交车出行时使用该软件,并回答以下问题:以下问题:1.1.它所提供的公交车运行信息是否及时准确?它所提供的公交车运行信息是否及时准确?2.2.它是否可以提供多种出行方案?它是否可以提供多种出行方案?基本准确基本准确可以提供多种出行方案可以提供多种出行方案3 3定位公交车位置信息需要哪些技术?它们各有什么定位公交车位置信息需要哪些技术?它们各有什么优缺点?优缺点?GPS/GPS/北斗定位技术、北斗定位技术、3G/4G3G/4G通信技术、通信技术、GISGIS地理信息系统技术地理信息系统技术 大数据分析带来价值的同时,也在隐

27、私保护、安全问题等方面带来危机。因大数据分析带来价值的同时,也在隐私保护、安全问题等方面带来危机。因此,合理、健康地使用大数据,遵循此,合理、健康地使用大数据,遵循“数据道德数据道德”是我们的必备品质。是我们的必备品质。存储是分布的呀!“分布式”的存储为以后“分布式处理”做准备,“分布”是高效处理的前提,否则大数据处理怎么这么快。处理也是分布!在分析之前对数据进行规整化是处理阶段的重要工作。一切为了提高效率!大数据分析的方法有很多,统计分析和数据挖掘也是大数据分析。大数据采集分布式文件存储分布式数据库存储分布式处理分析拓展知识拓展知识大数据分析的流程大数据分析的流程 因为大数据的量因为大数据的

28、量大到不能再使用常规大到不能再使用常规的方法进行存储和处的方法进行存储和处理,所以大数据分析理,所以大数据分析和普通的数据分析也和普通的数据分析也有所区别。大数据分有所区别。大数据分析的一般流程可以表析的一般流程可以表示如图示如图:1.1.某公司根据对上一年各个季度原材料供应商某公司根据对上一年各个季度原材料供应商A A送货量及时率的分析及建模,预测本季度该供应送货量及时率的分析及建模,预测本季度该供应商的订单履约率下降商的订单履约率下降2%2%。该过程最有可能用到的数据分析方法有?。该过程最有可能用到的数据分析方法有?()()A.A.平均分析平均分析 B.B.纵向对比分析纵向对比分析 C.C

29、.横向对比分析横向对比分析 D.D.一般分析一般分析2.2.某企业通过分析及统计不同的客户对于同一内容的刷新时间、处理时间及解决问题的时间等,某企业通过分析及统计不同的客户对于同一内容的刷新时间、处理时间及解决问题的时间等,推测一般用户的使用时间。该过程最有可能用到的数据分析方法有?(推测一般用户的使用时间。该过程最有可能用到的数据分析方法有?()A.A.平均分析平均分析 B.B.纵向对比分析纵向对比分析 C.C.横向对比分析横向对比分析 D.D.一般分析一般分析巩固提升B BACAC案例分析:根据大数据发现人们的出行规律案例分析:根据大数据发现人们的出行规律 在美国旧金山举行的在美国旧金山举

30、行的KDD2016KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文。论文指出,北京在们的研究论文。论文指出,北京在20142014年的前年的前9 9个月就有个月就有350350名扒手在地铁交通系统上被名扒手在地铁交通系统上被抓,抓,490490名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通数据名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪些数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪

31、些数据呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。参考答案:参考答案:案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交一卡通数据记录,分案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交一卡通数据记录,分析了析了896896条地铁经过的条地铁经过的4452444524个公交车站和个公交车站和1818条地铁经过的条地铁经过的320320个地铁站的数据。从出行轨个地铁站的数据。从出行轨迹提取特征。例如正常行人在从迹提取特征。例如正常行人在从A A地区到地区到B B地区会考虑最短时间、距离,或者最少

32、换乘,但地区会考虑最短时间、距离,或者最少换乘,但是类似是类似“A-C-D-BA-C-D-B”这种无目的的异常交通方式为异常行为。如果异常行为足够多,则他这种无目的的异常交通方式为异常行为。如果异常行为足够多,则他可能是一名扒手。具体的算法和模型,可见论文详细描述。(有兴趣的同学,再继续研究)可能是一名扒手。具体的算法和模型,可见论文详细描述。(有兴趣的同学,再继续研究)拓展练习课堂小结课堂小结走近数据分析走近数据分析体验公交出行体验公交出行体验实时公交体验实时公交数据分析的基本方法数据分析的基本方法数据可视化表达数据可视化表达数据分析报告数据分析报告对比分析法对比分析法平均分析法平均分析法大数据大数据地图软件地图软件含义含义重要作用重要作用

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 信息 > 教科版(2019) > 必修1 数据与计算
版权提示 | 免责声明

1,本文(5.1 走进数据分析ppt课件-2023新教科版《高中信息技术》必修第一册.pptx)为本站会员(Q123)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|