1、我们毕业啦其实是答辩的标题地方第一章 数据与信息1.3 数据采集与编码1.3.1数据采集1.3.2数字化1.3.3数制目录1.3.4编码数据采集数字化数制编码思考练习传统采集方式:传统采集方式:纸、笔纸、笔现代化的采集方式:现代化的采集方式:传感器、网络爬虫等传感器、网络爬虫等什么是传感器什么是传感器?传感器是一种能感受被测量并按照一传感器是一种能感受被测量并按照一定规律转换成可用输出信号的器件或定规律转换成可用输出信号的器件或装置,通常由敏感元件和转换元件组装置,通常由敏感元件和转换元件组成。成。互联网采集数据互联网采集数据 网络爬虫是一种按照一定规则,自动抓取网页上数据程序或脚本。网络爬虫
2、是一种按照一定规则,自动抓取网页上数据程序或脚本。网络爬虫是通过网页中的超链接在网页间跳转,根据需求按特定的关网络爬虫是通过网页中的超链接在网页间跳转,根据需求按特定的关键字获取某一方面的网页数据,然后对这些数据进行处理、储存等操作,键字获取某一方面的网页数据,然后对这些数据进行处理、储存等操作,并可用专门软件对数据进行分析。并可用专门软件对数据进行分析。数据采集数字化数制编码思考练习信息的分类:信息的分类:数据采集数字化数制编码思考练习数字化过程数字化过程数据采集数字化数制编码思考练习采样采样模拟信号模拟信号数字信号量化量化编码编码数据采集数字化数制编码思考练习数的进制二进制八进制十进制十六
3、进制进制是一种计数的方式1、数码:一个数制中所表示基本数值大小不同的数字符号;2、基/基数:指一个数制所使用的数码个数;3、权/权值:指每个数位中的1所对应的数值。例如:十进制564基数=10 4的 权值=100 6的权值=101 5的权值=102数据采集数字化数制编码思考练习进制的标识数据采集数字化数制编码思考练习数据采集数字化数制编码思考练习课堂练习课堂练习将十进制将十进制127、53转化为二进制转化为二进制将将1101.01B转化为十进制转化为十进制DB25.1325.014821202120212101.11012-1-0123数据采集数字化数制编码思考练习数据采集数字化数制编码思考练
4、习十进制十进制十六进制十六进制二进制二进制十进制十进制十六进制十六进制二进制二进制000881000111991001221010A1010331111B10114410012C11005510113D11016611014E11107711115F1111数据采集数字化数制编码思考练习数据采集数字化数制编码思考练习进制转换实践1010B=(D)111B=(D)25D=(B)65D=(B)10110010B=(D)=(O)=(H)107110011000001178262B2数据采集数字化数制编码思考练习数据采集数字化数制编码思考练习编码(编码(Encoding)是信息按照某种规则或格是信息按
5、照某种规则或格式,从一种形式转换为另一种形式的过程。式,从一种形式转换为另一种形式的过程。计算机存储容量最小的单位是比特(bit),1位二进制数码表示1个bit,但由于bit表示的值太小了,实际上计算机以8bit为一个基本单位,称为字节(Byte)。1字节(Byte)=8比特(bit)1024B=1KB 1024KB=1MB 1024MB=1GB1024GB=1TB 1024TB=1PB 1024PB=1EB1024EB=1ZB 数据采集数字化数制编码思考练习1.字符编码字符编码1)计算机内的英文字符以二进制编码的形式来表示,使用最广的是ASCII码(美国信息交换标准代码)一个ASCII码一般
6、用一个字节储存。基本的ASCII码有128个,用一个字节中的7个位来表示,即 。二进制范围:0000000001111111十六进制范围:007F A的ASCII码十进制是65,十六进制是41;可以推出B的十进制编码是66,十六进制是42;C的十进制编码是67,十六进制编码是43。72 数据采集数字化数制编码思考练习1.字符编码字符编码2)汉字编码计算机内的汉字字符以二进制编码的形式来表示,最常用的编码是GB2312,一般用2个字节表示一个汉字或汉语标点。分为:外码、交换码、机内码、字形码常用的输入码:拼音码、五笔码计算机内部的汉字编码都用机内码。数据采集数字化数制编码思考练习汉字编码汉字编码
7、数据采集数字化数制编码思考练习数据采集数字化数制编码思考练习数据采集数字化数制编码思考练习4.声音编码声音编码常见的声音文件类型有:Wave、MP3、WMA等;Wave格式音频文件的存储容量的计算公式:格式音频文件的存储容量的计算公式:存储容量存储容量=采样频率(采样频率(Hz)x量化位数(量化位数(bit)x声道数声道数x时长(时长(s)(单位:位)单位:位)数据采集数字化数制编码思考练习4.图像编码图像编码数字图像包括:矢量图和位图图像存储容量存储容量=总像素总像素x颜色位深度(单位:位)颜色位深度(单位:位)颜色的位深度:图像量化的长度(图像量化一般用二进制来表示)颜色的位深度:图像量化
8、的长度(图像量化一般用二进制来表示)如如256种颜色,它的位深度为种颜色,它的位深度为8位。位。格式有:BMP、JPEG、GIF、PNG5.视频编码视频编码存储空间需求大 矢量图矢量图形保存的文件大小一般比位图要小,并且形保存的文件大小一般比位图要小,并且文件大小与图形大小无关,文件大小与图形大小无关,在图像处理软件中任意在图像处理软件中任意放大矢量图形,不会丢失细节或影响清晰度,因为放大矢量图形,不会丢失细节或影响清晰度,因为矢量图形与分辨率无关。矢量图形与分辨率无关。位图图像又称为点阵图,点越多,图像越真实,位图图像又称为点阵图,点越多,图像越真实,越能体现细节,同时也需要更多的存储空间。
9、越能体现细节,同时也需要更多的存储空间。数据采集数字化数制编码思考练习 1、一张未经压缩的1024512像素的16色BMP格式的图像,其文件的存储容量大小约为()A.256KB B.1024KB C.2.5MB D.10MB答案:A 1024512481024=256KB 2、设语言信号的采样频率为10kHz,其量化位数为8位,双声道输出,则每秒钟的数据量约为()KB A.9.77 B.19.53 C.80 D.156.25答案:B 1010008281024=19.53KB数据采集数字化数制编码思考练习1、计算机中的数据用()表示的A、字母 B、ASCII码 C、二进制代码 D、英文答案:C
10、2、下列工具中不能把模拟图像转换成数字图像的是()A、扫描仪 B、数码相机 C、智能手机 D、打印机答案:D3、下列数值最大的是()A、101101B B、2CH C、40D D、101100B解析:A、D两项均为二进制,可将其他两个数转化为二进制再比较;2CH=101100B 40D=101000B答案:A4、已知英文字母m的ASCII码值为109,那英文字母p的ASCII码值为:_;答案:112数据采集数字化数制编码思考练习5、模拟音频数字化需要经过的步骤_、_、_;答案:采样、量化、编码6、二进制数11101转换成十进制数是_;答案:297、有一段WAVE格式的音频文件,采用44KHz的采样频率,量化位数为16位,双声道,时长为10秒,此音频文件的数据量大小为_B。答案:44100016210/8=1760000B