(2021新粤教版)高中信息技术必修一5.3数据的分析ppt课件.zip

相关 举报
  • 全部
    • 5.3数据的分析.pptx--点击预览
    • 关联分析.py
    • 数据分类.py
    • 数据预处理.py
    • 聚类分析.py

文件预览区

资源描述
第五章 数据处理和可视化表达 信息技术必修1数据与计算 5.3 数据的采集 上机课要求 上课前课代表同学提前与老师联系,确定上课事宜。 上课不能携带水、零食等进入机房。 进入机房按照编排机号入座,不得随意串座。 学习目标 1、能够体验多种数据分析技术; 2、能够掌握选用恰当的工具处理数据; 3、能够掌握总结和归纳数据分析的方法和步骤; 思考问题 生活中大数据时代的我们,前面我们学习了数据的采 集与保护,那么我们获取的数据可以直接拿过来用吗 ? 任务一:体验特征探索 特征探索的定义 以小组为单位,通过查找资料、学习和交流,填写下 表。 任务一:体验特征探索 特征探索的定义 以小组为单位,通过查找资料、学习和交流,填写下 表。 对数据进行预处理,发现和处理缺失 值,异常数据、绘制直方图,观察数 据分布的特征,求最大值、最小值、 极差等描述性统计量。 任务一:体验特征探索 小程序体验:数据预处理.py 修改“数据预处理.py”代码,对采集到的商品销售数据进行 预处理,包括发现和处理缺失值、处理异常数据、求最大 值、最小值、极差、组距、绘制直方图,观察数据的分布特 征,以小组为单位,通过学习、交流,探究(课本112-113页内 容) 任务一:体验特征探索 #异常值处理、画散点图(横轴:价格,纵轴:评论 数)找到异常值 data2=data.Tprice=data2.values2comt=data2.values3 plt.xlabel(price) #显示X坐标标签 plt.ylabel(paynum) #显示Y坐标标签 pyl.plot(price,comt,o)pyl.show() 任务一:体验特征探索 #求最值 pricemax=da22.max() pricemin=da22.min() paynummax=da23.max() paynummin=da23.min() #极差 pricerg=pricemax-pricemin paynumrg=paynummax-paynummin 任务一:体验特征探索 #极差pricerg=pricemax- priceminpaynumrg=paynummax-paynummin# 组距 pricedst=pricerg/13paynumdst=paynumrg/13 任务一:体验特征探索 #绘制价格直方图 #npy.arrange(最小,最大,组距) pricesty=npy.arange(pricemin,pricemax+1,pricedst) plt.xlabel(price) #显示X坐标标签 plt.ylabel(number) #显示Y坐标标签 pyl.hist(da22,pricesty) pyl.show() 任务二:体验关联分析 要求:以小组为单位,通过网上查找资料、学习和交流。 关联分析的 定义 分析发现存在于大量数据 之间的关联性和相关性, 从而描述一个事物的共同 规律和模式。 任务二:体验关联分析 要求:以小组为单位,通过网上查找资料、学习和交流。 小程序体验: 运行关联分析.py”体验关联分析。 修改 关联分析.py”代码,对采集到的店铺销售 订单数据进行关联分析,寻找商品之间的关联 性,观察关联分析结果,以小组为单位,通过 学习、交流,探究和实践, 任务三:体验聚类分析 以小组为单位,通过学习和交流,填写下表。 import numpy as np import numpy as np import matplotlib.pyplot as plt import matplotlib.pyplot as plt from pylab import * from pylab import * x = np.arange(-5.0, 5.0, 0.02) x = np.arange(-5.0, 5.0, 0.02) y = np.sin(x) y = np.sin(x) plt.plot(x, y) plt.plot(x, y) plt.show() plt.show() 任务三:体验聚类分析 以小组为单位,通过学习和交流,填写下表。 聚类分析的定义 是一种探索性的分析。不必事先给 出一个分类标准,而是让其自动分 类。 任务三:体验聚类分析 体验小程序: 修改 聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚 类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。 from sklearn.cluster import KMeans #导入商品样本数据 fname=data_sample.csv dataf=pda.read_csv(fname,encoding=gbk) x=dataf.as_matrix() #聚类分析 kms=KMeans(n_clusters=3) y=kms.fit_predict(x) print(y) 任务四:数据分类 以小组为单位,通过查找资料、学习和交流,填写下表。 数据分类 是数据分析中最基本的方法。先基 于样本数据构建分类器。然后进行 预测。 任务四:数据分类 以小组为单位,通过查找资料、学习和交流。 运行数据分类.py”,体验数据分类。 通过修改或优化数据分类py”代码,对特征值A为 128.8,特征值B为158,特征值C为4.7的商品进行分类, 观察该商品分类结果,以小组为单位,通过学习、交 流,探究和实践, 课堂练习 1、数据分析最基本的方法( ) A.特征探索 B.数据分类 C.聚类分析 D. 关联分析 B 课堂练习 2、下列有关数据分析说法错误的是( ) A.特征探索的主要任务是发现大量数据间的关联性 。 B.关联分析的主要任务是发现大量数据间的关联性 c.聚类分析无需事先给出分类标准 D.数据分类是数据分析处理中最基本的方法。 A 课堂总结 下课! 完成测试题,下节课前由小组长批阅,课代表汇总。 作业布置
展开阅读全文
相关搜索
资源标签
版权提示 | 免责声明

1,本文((2021新粤教版)高中信息技术必修一5.3数据的分析ppt课件.zip)为本站会员(大布丁)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


当前位置:首页 > 高中 > 信息 > 粤教版(2019) > 必修1 数据与计算


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|