1、数据采集与整理 学习目标 l 掌握数据采集和整理的基本方法, 能根据需求选择适当的工具采集与 整理数据。 l 应用恰当的方法保护数据,理解对 数据进行保护的重要意义,增强数 据安全意识。 体验探索 你能找到这些数据吗 1.数据采集 数据采集,即根据需求采用适当的方法 和工具获取所需要的数据。通常,数据采集 的主要环节包括明确数据需求,确定数据来 源,选择采集方法和实施数据采集。通俗地 说,就是找什么,去哪儿找,怎么找。 1.数据采集 明确数据需求 为提高数据采集的针对性,采集数据前 要明确数据需求。可以从需要分析的问题、 研究的内容、期望达成的目标等方面来考虑, 然后列出需要采集的数据目录。
2、1.数据采集 确定数据来源 在信息社会,数据来源途径广泛,社会 调查、公众媒体、科学实验与实践活动等都 可以提供大量数据。伴随着互联网的快速发 展,政府机构的官方网络平台已成为获取权 威数据的重要渠道。此外,物联网和社交网 络中也拥有巨量数据。 1.数据采集 选择采集方法 确定数据需求和数据来源后,应选择恰 当的方法采集数据。信息技术为高效精准地 采集数据创造了便利的条件,应用传感器和 网络等是当前数据采集的重要方法。 1.数据采集 选择采集方法 (1)传感器采集 1.数据采集 选择采集方法 (2)网络获取数据 2.数据整理 数据整理的目的是对数据进行校验和标 准化。 数据整理就是通过去重、补
3、漏和勘误等 方法,删除重复数据、补全缺失数据和校正 错误数据,并对数据进行统一性和标准化处 理,以确保数据是相关和准确的,从而将 “脏数据”变为“清洁数据”。 2.数据整理 例题:编写程序检测用水量为负值的数据。 l 阅读课本例题材料。 l 分析问题。 l 规划问题求解流程。 l 编程实现与调试。 l 保存文件,调试运行程序。 实践活动 编写程序删除用水量数据中的重复值 登录教学资源平台,找到“yongshui.csv” 文件。由于录入数据时操作失误,导致该文件 中多个省市的用水数据被重复输入。用Python 语言编写程序找到这些重复的数据,并删除。 3.数据安全 从健康数据到智慧交通,再到用
4、水决策, 进而到智能交互,数据正深刻地影响着大众生 活及国家建设的方方面面。数据已经成为一种 重要的资源,保护数据安全显得日益重要。 思考活动 我们的网上数据是否安全? 阅读材料思考: (1)我们的网上行为数据可能存储在哪里? 如果这些数据被泄露可能会带来哪些风险和 问题? (2)小组同学讨论,通过哪些措施可以使我 们的网络行为数据更安全? 3.数据安全 数据安全的威胁 数据安全的威胁来自很多方面,既有人 为因素,也有非人为因素。其中,主要的威 胁包括计算机病毒、黑客攻击、数据存储介 质损坏和个人失误等。 3.数据安全 2007-2017年移动互联网恶意程序数量走势 3.数据安全 数据保护的方法 l 数据备份 l 数据加密 阅读拓展 量子保密通信 量子通信是迄今唯一被严格证明的一 种无条件安全通信方式,可以有效解决信 息安全方面的问题。 阅读拓展 量子通信 谢谢