- 3.3.2 数据可视化之词云 ppt课件(47张ppt)+教案+练习_2023新人教中图版《高中信息技术》必修第一册
- 数据可视化之词云(第二十六课时)-教学设计.docx--点击预览
- 数据可视化之词云(第二十六课时)-课件.pptx--点击预览
- 数据可视化之词云(第二十六课时)-课后练习.docx--点击预览
文件预览区
|
|
资源描述
课程基本信息课题数据可视化之词云教科书书名:信息技术-必修一:数据与计算 出版社:人民教育出版社/中国地图出版社 出版日期:2019 年 8 月教学目标教学目标:知识与技能:理解词云的概念及意义,掌握在线和 Python 编程生成词云的方法。过程与方法:通过在线生成词云体验词云的意义,通过 Python 语言实现词云学习词云的生成方法,体验词云在文本可视化中的意义。情感态度与价值观:认识到词云在数据分析以及文本数据可视化过程中的价值和意义,从而认识到信息技术数字化方法对于个人生活和社会发展的重要作用。教学重点:掌握使用词云实现文本数据可视化的方法、Python 语言实现词云教学难点:Python 语言实现词云教学过程时间教学环节主要师生活动8 分钟环节一 词云的概念1、概念的引入(1)大数据时代(2)数据挖掘2、词云的概念(1)词云的概念(2)词云的制作步骤(3)人工制作词云3、活动一:人工制作词云图教师活动:讲解演示学生活动:完成活动任务,填写任务单15分钟环节二 词云的制作1、在线制作词云(1)网址:https:/ Python 编程生成词云(1)讲解 Python 语言生成词云的方法和步骤(2)Python 词云代码讲解(3)演示 Python 语言生成词云的编辑和运行(4)学生实践活动三:Python 语言实现词云教师活动:讲解演示学生活动:完成活动任务,填写任务单数据可视化之词云(第二十六课时)复习:数据可视化之图表AQI历年平均值年份AQI平均值201411020151122016102201787201882201971202068问题:文本数据如何可视化?北京空气污染调查报告北京空气污染调查报告 北京市预警中心、北京市空气重污染应急指挥部办公室11月26日发布了“空气重污染蓝色预警”称,受不利扩散条件影响,北京空气质量已达“5级重度污染”水平,建议公众做好健康防护,减少户外运动等。这也是北京今年(2016年)入冬以来第二次发布空气重污染预警。于是,北京的空气质量以及对人体健康影响再度引发公众的热议。空气中微生物和重金属会致病吗?对拉森团队的研究成果,北京市卫计委表示,细菌的耐药性和致病性是完全不同的概念,耐药性的增加不意味着致病性的增强。.文本可视化的方式:词云词云应用举例国国际际互互联联网网大大会会词词云云图图时代背景:大数据时代奥地利科学家维克托迈尔-舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一,2012年他在大数据时代中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维方式。时代背景:大数据时代根据国际互联网数据中心预测:2025年全球每年产生的数据将达到175ZB。如果把175ZB全部存在DVD光盘中,那么DVD叠加起来的高度可以绕地球222圈。现实问题:数据量大幅度增加数据挖掘数据挖掘是指从大量的数据中通过算法获取隐藏于其中信息的过程。数据挖掘通过统计学、机器学习、专家系统和模式识别等诸多方法来实现上述目标。文本数据挖掘数据挖掘的一个分支,叫做文本数据挖掘,顾名思义,文本数据挖掘,就是从文本中进行数据挖掘,以快速获得文本中的重要信息。文本可视化最常用的方法就是词云。文本数据挖掘的主要步骤:文本数据挖掘的主要步骤:文本获取、文本处理、文本可视化词云的概念你发现了词云的哪些特点?词云的概念特点:图片词汇颜色大小词云是一种可视化描绘词语出现在文本数据中的频率的方式。词云的概念客客户满意度意度文本文本词云云客客户满意度意度1、词汇区分(分词)2、统计词频3、图形显示词云的制作步骤鸡蛋 牛奶 面包 豆浆 油条 鸡蛋 鸡蛋牛奶 包子 鸡蛋 牛奶 面包体验词云:人工制作词云早餐统计单:鸡蛋牛奶面包豆浆油条包子体验词云:人工制作词云步骤一:词汇区分鸡蛋 牛奶 面包 豆浆 油条 鸡蛋 鸡蛋 牛奶 包子 鸡蛋 牛奶 面包体验词云:人工制作词云步骤二:词频统计食物名称食物名称出现频率出现频率鸡蛋4牛奶3面包2豆浆1油条1包子1鸡蛋 牛奶 面包 豆浆 油条 鸡蛋 鸡蛋牛奶 包子 鸡蛋 牛奶 面包体验词云:人工制作词云步骤三:绘制图形鸡蛋 牛奶 面包 豆浆 油条 鸡蛋 鸡蛋牛奶 包子 鸡蛋 牛奶 面包活动一:人工制作词云请大家暂停视频,按照前面的操作步骤,人工制作早餐食物的词云图,把制作的词云图拍照或者截图粘贴在任务单中。鸡蛋 牛奶 面包 豆浆 油条 鸡蛋 鸡蛋 牛奶 包子 鸡蛋 牛奶 面包早餐统计单:任务单在线制作词云在线制作词云步骤一:打开网站打开浏览器并在地址栏输入网址https:/ words”按钮在线制作词云步骤2:导入文本系统自动显示分词结果和词频统计。在线制作词云步骤2:导入文本点击右侧的“Options”按钮,设置文字重复次数。在线制作词云步骤2:导入文本在弹出的对话框中的“Repeat”选项中选择“None”。在线制作词云步骤3:选择图形:点击“SHAPES”菜单,选择一个词云的图形,选中的图形背景显示为蓝色。在线制作词云步骤4:导入字体打开“FONTS”菜单,然后点击下方的“Add font”按钮添加字体。在线制作词云步骤4:导入字体在对话框中定位到素材文件夹中的宋体字体文件“SimSun.ttf”。添加完成后,该字体会出现在系统的字体列表中,点击选中该字体。选中后背景为蓝色。在线制作词云步骤5:生成词云图点击上方红色的“Visualize”按钮,即可生成词云图。活动二:在线实现词云活动任务:素材文件夹中的“kongqi.txt”文档内容为北京空气污染调查报告,请应用此文档在wordart网站在线生成词云,将生成的词云图截图并填写活动任务单。任务单Python语言实现词云Python语言实现词云工具包介绍:jieba,中文分词工具包。根据汉字之间的关联概率形成分词结果。wordcloud,词云生成工具包。可以图形化的展示文本文字及其出现的频率。imageio,image类型图片工具包。提供image类型图片相关操作工具。Python语言实现词云右图为某招聘网站的招聘信息文档截图,制作这个的词云图以快速了解应聘所需的关键技术。任务介绍:Python语言实现词云文本文件(必备)字体文件(可选)图像文件(可选)程序文件(参考)材料准备:Python语言实现词云运行命令行工具:AnacondaPrompt在窗口依次输入以下命令:pip install imageio pip install jiebapip install wordcloud步骤步骤1 1:安装工具包安装工具包步骤步骤2 2:运行:运行SpyderSpyder软件。软件。Python语言实现词云步骤步骤3 3:编辑代码。编辑代码。Python语言实现词云在左侧编辑区输入程序代码(详细代码在后文)详细代码-1#1、导入需要用到的库from imageio import imreadimport matplotlib.pyplot as pltfrom wordcloud import WordCloudimport jieba#2、读取文本并分词text=open(“zhaopin.txt,rb).read()text_jieba=.join(jieba.cut(text)bg_pic=imread(“back.png)代码对应解释导入imageio工具包导入matplotlib工具包导入wordcloud工具包导入jieba工具包读取文档区分词汇加空格读取图片文件详细代码-2#3、配置词云参数,生成词云wc=WordCloud(font_path=simsun.ttf,background_color=white,max_words=200,mask=bg_pic,max_font_size=100 )wc.generate(text_jieba)代码对应解释定义词云对象读取字体文件设置背景颜色设置最大词汇数量设置词云应用图片设置最大字体尺寸用文本生成词云对象详细代码-3#4、生成图片并显示plt.figure()plt.imshow(wc)plt.axis(off)plt.show()wc.to_file(map.jpg)代码对应解释生成图形实例实现词云图形绘制关闭坐标轴显示词云图形生成词云图片文件步骤步骤4 4:运行程序。:运行程序。Python语言实现词云在右侧的Console面板中会显示生成的词云图片。活动三:Python语言实现词云活动任务:“zhaopin.txt”文档内容为某招聘网站的招聘信息,请使用Python语言生成此文档的词云图,将生成的词云图截图,从图中找出五个关键词,完成后填写活动任务单。任务单1 词云的概念 词云的时代背景、概念、用途。总结2 词云的制作 制作词云的三种方式:人工方式、在线方式、编程方式作业任务内容:“ai.txt”文档为新一代人工智能发展规划,请以此文档在线生成词云,找出5个高频率关键词,进而判断人工智能未来发展的关键技术,完成后填写作业任务单。任务单自主学习任务单学习指南1.课题名称:数据可视化之词云2.学习目标:掌握数据词云的概念、历史,了解制作词云的基本步骤。掌握在线制作词云和 Python 语言制作词云的过程和方法。3.本节知识点思维导图:学习任务课前测验:(了解学情)(1)使用 Python 语言定义一个包含 10 个整数的列表。(2)什么是大数据?活动一:人工制作早餐食物的词云图,把制作的词云图拍照或者截图。词云图词云图活动二:素材文件夹中的“kongqi.txt”文档内容为北京空气污染调查报告,请应用此文档在 wordart 网站在线生成词云,将生成的词云图截图词云图词云图关键词关键词1.1.2.2.3.3.4.4.5.5.活动三:“zhaopin.txt”文档内容为某招聘网站的招聘信息,请使用 Python 语言生成此文档的词云图,将生成的词云图截图,从图中找出五个关键词词云图词云图关键词关键词1.1.2.2.3.3.4.4.5.5.课后作业:“ai.txt”文档为新一代人工智能发展规划,请以此文档在线生成词云,找出 5个高频率关键词,进而判断人工智能未来发展的关键技术,完成后填写作业任务单。词云图词云图关键词关键词1.1.2.2.3.3.4.4.5.5.关键技术:关键技术:拓展阅读资料大数据经典案例1.啤酒与尿布啤酒与尿布全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。2.数据新闻让英国撤军2.数据新闻让英国撤军2010 年 10 月 23 日卫报利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达 39 万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。3.微软大数据成功预测奥斯卡 21 项大奖3.微软大数据成功预测奥斯卡 21 项大奖2013 年,微软纽约研究院的经济学家大卫罗斯柴尔德(DavidRothschild)利用大数据成功预测 24 个奥斯卡奖项中的 19 个,成为人们津津乐道的话题。今年罗斯柴尔德再接再厉,成功预测第 86 届奥斯卡金像奖颁奖典礼 24 个奖项中的 21 个,继续向人们展示现代科技的神奇魔力。评测反思1.知识小测:结合微课资源,完成以下题目:制作词云的主要三个步骤是什么?2.学习评价:评价指标评价等级及分值得分优秀9-10 分良好5-8 分一般3-4 分自评互评老师评项目实践完成度(50%)项目自主创新与个性化设计(10%)项目学习交流合作(20%)成 果 展 示(20%)3.学习反思:(1)通过本节课的学习,你最大的收获是什么?(2)在实践操作环节,遇到了哪些困难?你是如何解决的?(3)关于本节课的学习内容,列出你最想进一步研究的内容。
展开阅读全文
相关搜索
资源标签