1、2022-8-1212022-8-122知识结构策划表达方式根据需求加工信息创作电子作品尝试开发技巧文本图表图像音视频确定主题创意搜集素材加工制作测试发布作品评价素材加工网页制作文本、图像、音频、视频版面设计集成制作特效处理初识人工智能HML文档特效程序文档规则链接实现窗体处理嵌入程序规则程序实现人工智能的来源和含意人工智能的初步应用知识结构拥有我的计算机畅想我们的未来项目设计计算机系统项目背景项目规化项目案例项目实施交流与评价硬件系统软件系统基本组成外部设备信息改变生活数字创造未来多媒体技术网络技术数据库技术算法与程序设计系统软件应用软件主板、CPU、内存显卡、声卡网卡等打印机、扫描仪数码相
2、机等人工智能2022-8-125数据清理筛选数据清理筛选数据数据目标数据目标数据预处理预处理及变换及变换变换后的数据变换后的数据数据挖掘数据挖掘解释解释/评估评估2022-8-126数据仓库数据仓库数据清理数据清理 数据集成数据集成过滤过滤数据库数据库数据库或数据仓库服务器数据挖掘引擎模式评估图形用户界面 知识库2022-8-1272022-8-1282022-8-1292022-8-12102022-8-12112022-8-12122022-8-1213数据清理数据清理数据集成数据集成数据转换数据转换数据归约数据归约2022-8-12142022-8-12152022-8-12162022
3、-8-12172022-8-12182022-8-12192022-8-12202022-8-1221xyy=x+1X1Y1Y12022-8-12222022-8-12232022-8-12242022-8-1225BABAnBBAAr)1()()(,ABAB2022-8-12262022-8-1227AAminnewmaxnew_,_AAAAAAminnewminnewmaxnewminmaxminvv_)_(2022-8-1228Avv jvv10Where j is the smallest integer such that Max(|)Reduced attribute set:A1
4、,A4,A6YYYNNN2022-8-12362022-8-12372022-8-1238count51015202530123456789101-1011-2021-30510152025132515PricePricecount2022-8-12392022-8-12402022-8-12412022-8-12422022-8-1243count51015202530123456789101-1011-2021-30510152025132515PricePricecount2022-8-12442022-8-12452022-8-1246n例例1:包含数据:包含数据:101、110、20
5、3、222、305、315n方法:最高位包含方法:最高位包含3个值(个值(1、2、3)n分成分成100,200),),200,300),),300,400)三段)三段n例例2:包含数据:包含数据:101、110、103、422、405、415,400n方法:最高位包含方法:最高位包含2个值(个值(1、4)n分成分成100,150),),150,200),400,450),450,500)四段)四段n例例3:包含数据:包含数据:101、210、203、322、305、415,500n方法:最高位包含方法:最高位包含5个值(个值(1、2、3、4、5)n分成分成100,200),),200,300)
6、,300,400),400,500),),500,600)五段五段2022-8-12472022-8-1248countryprovince_or_ statecitystreet15 distinct values65 distinct values3567 distinct values674,339 distinct values2022-8-1249主要内容主要内容l为什么需要数据预处理为什么需要数据预处理?l数据清洗数据清洗 l数据集成与转换数据集成与转换l数据归约数据归约l数据离散化与概念层次的构建数据离散化与概念层次的构建l本章小结本章小结2022-8-12502022-8-1251信息可视化数据挖掘可视化 数据挖掘2022-8-12522022-8-12532022-8-12542022-8-12552022-8-12562022-8-12572022-8-12582022-8-12592022-8-12602022-8-12612022-8-12622022-8-12632022-8-12642022-8-1265