1、5.1 走近数据分析(第走近数据分析(第2课时课时) 【教学目标【教学目标 1. 了解大数据的含义,认识大数据分析在 信息社会的重要作用。 2、了解大数据的应用及影响。 【教学重点】【教学重点】 大数据及其意义 案例分析:案例分析:体验体验实时实时公交公交 假如来到一个陌生的地方,需要知道自己所处 的具体位置,手机里的地图软件可以很方便地 帮助你定位。体验一款手机地图软件,获取你 的当前位置、计算并推荐去目的地的路线。 打开手机地图软件,体验地图软件的魅力。(小组打开手机地图软件,体验地图软件的魅力。(小组 间可讨论研究)间可讨论研究) 析:析:很多地图软件提供了“全景模式”。选择“查 看全景
2、”可以展示实地拍摄的“全景”照片,。在 照片上可以多角度查看场景。点击移动方向箭头, 场景则根据位置改变。 (地图软件)(地图软件) “全景全景”模式模式 卫星图卫星图 如果一个拍摄点需要拍摄如果一个拍摄点需要拍摄8张照片,每张照片的大张照片,每张照片的大 小约为小约为4MB,1个拍摄点的照征数据量是多少?个拍摄点的照征数据量是多少? 考虑到地图的连续性,如果相邻拍摄点间隔为考虑到地图的连续性,如果相邻拍摄点间隔为16 米,那么一条长米,那么一条长1千米的街道需要多少张照片?数千米的街道需要多少张照片?数 据量是多少据量是多少? 如果一个城市呢?如果一个城市呢? 4*8=32MB,所以一个拍摄
3、点的照片的数据量为32MB。 1000/16=62.5,所以需要63个拍摄点,63*8=504张,所以需要 拍摄504张照片。4*504=2016MB,所以数量量是2016Mb或者 是1.97GB。 数据量如此庞大。 附存储单位: 二、大二、大数据数据 1、大数据、大数据 大数据:大数据:是以容量大、类型多、存取速度快、应用价值高为主要特 征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样 的数据进行采集、存储和关联分析,从中发现新知识,创造新价值、 提升新能力的新一代信息技术和服务业态。 2、大数据的意义:、大数据的意义: 我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于 管
4、理、农业、金融、医疗和教育等各个社会领域,为社会发展服 务。 三、大数据分析的三、大数据分析的应用应用 活动活动2 公交车距离我多远公交车距离我多远 体验一款实时公交软件,输入起点和终点,获取所需的公交方案, 并了解公交车和你之间的距离并填写下表。(高德实时公交高德实时公交) 实时公交信息查询软件使用体验实时公交信息查询软件使用体验 序号序号体验并思考问题体验并思考问题结果结果 1查看该软件为用户提供了哪些实用功能?查看该软件为用户提供了哪些实用功能? 2 如果有条件,乘公交车出行时使用该软件,并回答如果有条件,乘公交车出行时使用该软件,并回答 以下问题:以下问题: 1.它所提供的公交车运行信
5、息是否及时准确?它所提供的公交车运行信息是否及时准确? 2.它是否可以提供多种出行方案?它是否可以提供多种出行方案? 3 定位公交车位置信息需要哪些技术?它们各有什么定位公交车位置信息需要哪些技术?它们各有什么 优缺点?优缺点? 三、大数据分析的三、大数据分析的应用应用 活动活动2 公交车距离我多远公交车距离我多远 体验一款实时公交软件,输入起点和终点,获取所需的公交方案, 并了解公交车和你之间的距离并填写下表。(高德实时公交高德实时公交) 实时公交信息查询软件使用体验实时公交信息查询软件使用体验 序号序号体验并思考问题体验并思考问题结果结果 1查看该软件为用户提供了哪些实用功能?查看该软件为
6、用户提供了哪些实用功能?路线、时间及距离查询路线、时间及距离查询 2 如果有条件,乘公交车出行时使用该软件,并回答如果有条件,乘公交车出行时使用该软件,并回答 以下问题:以下问题: 1.它所提供的公交车运行信息是否及时准确?它所提供的公交车运行信息是否及时准确? 2.它是否可以提供多种出行方案?它是否可以提供多种出行方案? 基本准确基本准确 可以提供多种出行方案可以提供多种出行方案 3 定位公交车位置信息需要哪些技术?它们各有什么定位公交车位置信息需要哪些技术?它们各有什么 优缺点?优缺点? GPS/北斗定位技术、北斗定位技术、3G/4G 通信技术、通信技术、GIS地理信息系统地理信息系统 技
7、术技术 (软件界面)(软件界面) (公交查询)(公交查询) (线路查询)(线路查询) (时间及距离查询)时间及距离查询) 总结:总结:实时公交信息查询软件可以实时反馈公交车 实时公交信息查询软件可以实时反馈公交车 辆的运行信息,提升乘客的出行效率。辆的运行信息,提升乘客的出行效率。 大数据分析带来价值的同时,也在隐私大数据分析带来价值的同时,也在隐私 保护、安全问题等方面带来了危害。因保护、安全问题等方面带来了危害。因 此,合理健康地使用大数据,遵循此,合理健康地使用大数据,遵循“数数 据道德据道德”是我们的必备品质。是我们的必备品质。 四、大数据分析的四、大数据分析的流程流程 因为大数据的量
8、大到不能再使用常规的方 法进行存储和处理,所以大数据分析和普 通的数据分析也有所区别。大数据分析的 一般流程可以表示为: 存储是分布的呀!“分布式”的存储为以后 “分布式处理”做准备,“分布”是高效处理 的前提,否则大数据处理怎么这么快。 处理也是分布!在分析之前对数据进行规整化 是处理阶段的重要工作。一切为了提高效率! 大数据分析的方法有很多,统计分析和数据挖 掘也是大数据分析。 大数据采集 分布式文件存储分布式数据库存储 分布式处理 分析 案例分析案例分析:根据:根据大数据发现人们的出行大数据发现人们的出行规律规律 在美国旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大 家
9、报告了他们的研究论文。论文指出,北京在2014年的前9个月就有350名 扒手在地铁交通系统上被抓, 490名扒手在公交车上被抓。因此,他们认 为可以通过对北京智能公交一卡通数据进行分析研究,根据异常交通记录 分析来抓小偷。如要实现这个功能,要调用哪些数据呢?同学们也可以上 网搜索相关资料,了解大数据专家是如何分析的。 参考答案:参考答案: 案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交 一卡通数据记录,分析了896条地铁经过的44524个公交车站和18条地 铁经过的320个地铁站的数据。从出行轨迹提取特征。例如正常行人 在从A地区到B地区会考虑最短时间、距离,或者最少换乘,但是类似 “A-C-D-B”这种无目的的异常交通方式为异常行为。如果异常行为足 够多,则他可能是一名扒手。具体的算法和模型,可见论文详细描述。 (有兴趣的同学,再继续研究) 再见!再见!