1、突 破 自 我 创 新 才 能 发 展D ATA C O D I N GABC了解各类数据采集的基本方法能够解释文本、音频等数据的编码原理理解数据编码的意义和作用学习目标目录CONTENT数据编码二 进 制 与 数 制 转 换声音图片大小的计算文 本 数 据 的 编 码文字声音图像数字设备编码数 据模拟数据数字数据数字化编码:信息从一种形式或格式转换为另一种形式或格式的过程数字化:将文字、图像、声音、视频等数据转换成手机或计算机中可以保存、处理、传输、发布的对象即数字化过程程。数字化是将复杂多样的事物属性或特征转化为计算机可以处理对象的过程。优势:便于在数字设备中存储、处理和传输。1数据编码P
2、ARTA信号按取值特征用传感器直接获得的信号如声音、温度、压强。用连续变化的物理量来表示信息。值随时间连续变化,波形光滑01模拟信号02可由模拟信号转换得来数字信号的值即数字数据直接用计算机所能理解的二进制表示数字信号模 拟 信 号 与 数 字 信 号模拟信号模拟数据最小值最大值0时间模 拟 信 号 的 数 字 化模拟数据最小值最大值0时间采样接近0接近2接近4接近3接近1接近2接近2量化编码10243122(十进制)1001 1100 0100 1100 0011 00102二进制与数制转换PART数制转换数制的基本要素:数码:每位上可能的基本数字。基数:每位上可能的数码个数。位权:每位上的
3、1所表示的数值大小。数制转换十进制 数码:每位上可能的基本数字。基数:每位上可能的数码个数。位权:每位上的1所表示的数值大小。从右向左依次是:100、101、102、103 规则:0、1、2、3、4、5、6、7、8、9逢十进一(1+9=10)数制转换十进制数125:1 2 5位权:125=1102+2101+5100102100101数制转换二进制 数码:每位上可能的基本数字。0、1 基数:每位上可能的数码个数。位权:每位上的1所表示的数值大小。从右向左依次是:20、21、22、23 规则:逢二进一(1+1=10)数制转换十进制数二进制数数制转换2222218 9 4 2 1 0 十进制转二进
4、制:例:十进制18二进制数01001低位高位余数18(10)=10010(2)除2反向取余法数制转换二进制转十进制:按权展开求和例:二进制10010 十进制数(1 0 0 1 0)22423222120=124+023+022+121+020=16+0+0+2+0=18数制转换 不同位数的二进制数,能不同位数的二进制数,能表示几种状态?又能表示的表示几种状态?又能表示的十进制数的范围是多少?十进制数的范围是多少?二 进 制比特,计算机中存储数据的最小单位。1比特表示两种状态,0或1。2比特表示四种状态,00、01、10、11。3比特八种状态,000、001、010、011、100、101、11
5、0、111字节,计算机存储数据的基本单位(Byte,简写B),1字节二进制数表示28(256)数制转换存储单位换算关系B(byte),字节1B=8b(bit,位)KB(kilobyte),千字节KB=210B =1024BMB(megabyte),兆字节1MB=210KB=1024 KBGB(gigabyte),吉字节1GB=210MB=1024MB字节单位太小,常用的存储单位有KB,MB,GB等。更高的还有TB太字节、PB拍字节、EB艾字节数制转换二进制数表示状态能表示的十进制数范围1位21种 0/12位22种 00 01 10 113位23种 000 001 010 011 100 101
6、 110 111n位2n种 0 10 30 70 2n-1二进制:0 1(逢二进一)十六进制:0 1 2 3 4 5 6 7 8 9 A B C D E F(逢十六进一)1324进 制进制八进制:0 1 2 3 4 5 6 7(逢八进一)十进制:0 1 2 3 4 5 6 7 8 9(逢十进一)数制转换222218 2 0 十进制转R进制:除R反向取余法例:十进制18八进制数22低位高位余数18(10)=22(8)88数制转换18(10)=10010(2)18(10)=22(8)010 010 2 2二进制转八进制:从右往左,3位一组,不够补0数制转换八进制转二进制:1位八进制数转换为3位二进
7、制(123)8=(1010011)221012 21 023112200111-1-0012-10-0103-11-011(123)8=(1010011)2数制转换222218 1 0 十进制转R进制:除R反向取余法例:十进制18十六进制数21低位高位余数18(10)=12(16)1616数制转换18(10)=10010(2)0001 0010 1 2 二进制转十六进制:从右往左,4位一组,不够补018(10)=12(16)数制转换十六进制转二进制:1位十六进制数转换为4位二进制210 12 2102 3112200111-1-00012-10-00103-11-0011(123)16=(10
8、0100011)2数制转换十进制R进制除R取余法按权展开求和法总结:数制转换练习:10110100(2)=()(10)3D(16)=()(10)255(10)=()(16)100(10)=()(2)E2(16)=()(2)11100101(2)=()(16)18061FF110010011100010E5数制转换(程序体验)bin()输出二进制 0b前缀oct()输出八进制 0o前缀hex()输出十六进制 0 x前缀 dec 代表十进制注:结果显示均为字符串数制转换(程序体验)bin(100)#将十进制整数100转换为二进制0b1100100#前缀0b表示二进制(字符串类型)oct(100)#
9、将十进制整数100转换为八进制0o144#前缀0o表示八进制(字符串类型)hex(100)#将十进制整数100转换为十六进制0 x64#前缀0 x表示十六进制(字符串类型)十进制 R进制 数制转换(程序体验)0 x40#返回结果为字符串,前缀0 x表示十六进制 hex(0o100)#将八进制数100转换为十六进制?oct(0b100)#将二进制数100转换为八进制?0o4#返回结果为字符串,前缀0o表示八进制 bin(0 x100)#将十六进制数100转换为二进制?R进制 R进制 !加进制前缀0b100000000#返回结果为字符串,前缀0b表示二进制数制转换(程序体验)二进制 0b八进制 0
10、o十六进制 0 x十进制转成R进制bin(?)oct(?)hex(?)R进制之间的转换bin(前缀+数)oct(前缀+数)hex(前缀+数)R进制转成十进制int(0b+数)int(0o+数)int(0 x+数)3声音图片大小的计算PART声音文件大小的计算一段一段时长时长1 1分钟分钟,采样频率为采样频率为44.1K44.1KHzHz,量化位数为量化位数为1616位位,双声道双声道立体立体声声的无压缩音频,的无压缩音频,其占用的存储空其占用的存储空间是间是 MBMB?(?(精确到精确到0.1)0.1)声音文件大小的计算采样:采样:在横轴上按一定的在横轴上按一定的时间间隔时间间隔从信号中取一个
11、瞬时值,这个从信号中取一个瞬时值,这个过程称为采样。过程称为采样。(时长时长)采样频率:采样频率:录音设备在录音设备在1 1秒内对声音信号的采样次数称为采样频秒内对声音信号的采样次数称为采样频率。常用的率。常用的CDCD音质的采样频率是音质的采样频率是44.1KHz44.1KHz。量化:量化:将信号波形的纵轴划分为若干区间。落到某一区间的采样将信号波形的纵轴划分为若干区间。落到某一区间的采样点按四舍五入额规则取整选值,这个过程称为量化。点按四舍五入额规则取整选值,这个过程称为量化。声音文件大小的计算一段一段时长时长1 1分钟分钟,采样频率为采样频率为44.1KHz44.1KHz,量化位数为量化
12、位数为1616位位,双声道双声道立体声立体声的无压缩音频,的无压缩音频,其占用的存储空间是其占用的存储空间是 MBMB?(?(精确到精确到0.1)0.1)声音文件大小(单位:B,字节)=时长(秒)*采样频率(Hz)*量化位数*声道数/8=60*44.1*1000*16*2/8=10584000B 10335.9KB 10.1MB图片文件大小的计算 图像尺寸即组成图像的像素的数量。例:图像尺寸68像素,即横向6个 像素(宽度);纵向8个像素(高度)组成。图片文件大小的计算 图像尺寸即组成图像的像素的数量。例:图像尺寸68像素,即横向6个像素(宽度);纵向8个像素(高度)组成。图片文件大小的计算u
13、 常见的彩色图像深度有8位、16位、24位(RGB)、32位等。u 色彩深度为n,能代表的颜色就有2n种。u 色彩深度越大,图像文件的色彩越丰富,文件占用空间越大。图片文件大小的计算图片文件大小(单位:字节Byte)=图像宽度*图像高度*色彩深度/8 如俗称如俗称40004000万像素相机拍摄的一张万像素相机拍摄的一张2424位真彩色、位真彩色、分辨率为分辨率为72967296*54725472的的BMPBMP图像占用的空间大小是?图像占用的空间大小是?图片文件大小的计算 如俗称如俗称40004000万像素相机拍摄的一张万像素相机拍摄的一张2424位真彩色、位真彩色、分辨率为分辨率为72967
14、296*54725472的的BMPBMP图像占用的空间大小是?图像占用的空间大小是?大小=72965476248 =119771136 B 114.223 MB4文本数据的编码PART 计 算 机 如 何 处 理 字 符字符串就是文本,可以是字母、数字、下划线。字符串与数字区别在于字符串两边需要加 字符(文字、符号)数字(二进制等)预先确定的规则编码方案每个字符拥有对应的数字编码,便于不同计算机系统间交换信息IASCII码 英文字母(大小写)数字 英文标点符号0共128个美国国家信息标准协会制定 ASCII 美国信息交换标准代码 因此,计算机内部用一个字节(8位)即可存放一个ASCII字符,最
15、高位用 0 表示 注:一个字节=8位,1位可存放2个字符,27可存放128个,28可存放256个IASCII码ASCII码(十进制)字符031控制字符或通信专用字符(不可见)32空格4857数字096590大写英文字母AZ97122小写英文字母az其他英文标点符号、运算符号、括号IASCII码 英文字母(大小写)数字 英文标点符号0共128个“A”1 01000 0 0“65”汉 字 的 编 码GB 2312-1980 字符集,收录 6763 个汉字GBK 字符集,兼容GB 2312-1980 标准,收录21003个汉字GB 18030-2005 字符集,收录70244个汉字GB 18030-2000 字符集,收录27533个汉字ASCII 用一个字节表示。每个汉字至少需要两个字节,16位。通用字符编码方案 Unicode字符集 Unicode字符集,是全球可以共享的编码字符集,涵盖了世界上主要文字的字符,其中包括简繁体汉字,共计74686个汉字。例:汉字“男”,Unicode编码为30007(10)/7573(16)/0111010100110111(2)突 破 自 我 创 新 才 能 发 展