1、第 十一 课 语音识别技术 浙教版 八年级下 新知导入 同学们,观看下面这副图,微信里有这个功能,你认为它什么 用处呢? 语音转换成文字,利用了 语音识别技术 新知导入 语音识别录入比打字快3倍 新知导入 语音识别是以语音为研究对象,通过语音信号处理 和模式识别让机器自动识别和理解人类口述的语言 。 新知讲解 一、语音识别的过程 语音识别基本过程:通过数模转化得到一个数字声音信 号,对该声音信号进行预处理和特征提取,将该特征在声学模型 中进行模式匹配得到音素序列,最后在语言模型中查找该音素序 列匹配概率最高的文本,并输出识别结果。语音识别过程如图11 -1锁定所示。 图 11-1 语音识别的过
2、 程 新知讲解 语音识别原理是什么呢? 新知讲解 1.声音数字化 声音数字化是指对于连续变化的声音物理信号,每隔一段时间 ,测得模拟信号的电压值,给出该电压值相应的量化值,并在计算中 用0和1表示。通过声卡将模拟信号转换为数字信号。声音数字化过程 如图11-2所示。 图 11-2 模拟转换的过程给 新知讲解 2.信号预处理 信号预处理是指对语音信号进行降噪、消除杂音等处理后得到 一个比较干净的语音信号。 新知讲解 3.特征提取 特征提取就是每隔一定时间,把声音的音调、音长等特征提取 出来的过程。 新知讲解 4.模式匹配 模式匹配就是将提取出来的特征在声学模型中进行比对,得到 一组音素序列。音素
3、是根据语音的自然规律划分出的最小语音单位。 汉语拼音中的“a、b、p”等可视为一个个音素。例如“国家”这 个单词包含“g、uo、j、i、a”这些音素。把音素按照语言规律组合 起来,就构成了每个单词的发音。 新知讲解 知识链接 声学模型 通过采集成千上万个人的发音样本,提取每 个单词所包含音素的发音特征,形成声学模型。由于普通话 和地方方言的发音特征不同,因此根据样本的语言,可形成 不同的声学模型。同一发音在不同模型中识别的效果是不一 样的。 新知讲解 5.语言处理 语音处理是指根据匹配到的音素序列,在语言模型中找到概率 最高的文本并输出识别结果。 不同单词之间的搭配,在语句中出现的概率是不一样
4、的。常用 的词语出现概率会比其他的更高,也会被优先输出。单词的搭配还应 该符合语言习惯,如“起床上学”比“上学起床”出现的概率更高。 新知讲解 知识链接 语言模型 对搜集到的海量语句进行分析统计,获得单词之间搭 配的概率关系,从而形成语言模型。 新知讲解 二、语音识别的实践 百度、腾讯等人工智能开放平台集成了大量的声学模型和语言 模型。通过这些平台提供的软件开发工具包,可以把录制的声音传送到 平台进行识别,并返回识别结果。例如,利用百度语音识别软件开发工 具包,可以识别已录制的myaudio.wav文件中的语音信息,部分识别程 序如图11-3,识别过程及结果如图11-4所示。 新知讲解 图 1
5、1-3 主程序部分代 码 图 11-4 语音转换成文 本 新知讲解 尝试在其他人工智能开放平台、APP或相关软件中,将录制的 myaudio.wav文件转换成文本。 亲身体验 讯飞开放平台可进行语 言的选择。 新知讲解 亲身体验 讯捷文字语音转换器 新知讲解 语音识别的准确率与声学模型和语言模型密切相关。如果声 学模型是用普通话训练的,那么识别方言语音的准确率就相对较 低。通过及时更新地名、网络流行语等词汇,在语言模型中改变 单词之间的搭配概率,可以有效地提高新单词的识别率。语音识 别的准确率还与录音时周边环境的噪音、录声设备的质量等因素 有关。 日积月累 新知讲解 随堂练习 1.想一想:你在
6、哪里见过语音识别的应用? 车载导航、语音搜索、曲目识别、家电遥控等。 新知讲解 随堂练习 1.录制一段语音,在人工智能开放平台、APP或软件中 ,将录制的语音分别转换成文本,并统计转换后文本的准确率 。 录制的语音文件名:_, 包含文字(不 含标点)的数量:_个 如:语音识别.mp3 120 新知讲解 随堂练习 序号平台、APP或软件的名称识别出正确的文字数量准确率 1 2 3 4 如:讯飞 100个90% 新知讲解 随堂练习 2.选择不同的“发音人”或方言对同一段文本信息进行录制 ,然后在统一平台、APP或软件中进行测试,并统计识别的准确率。 文本信息中包含文字(不含标点)的数量:_个。平台
7、、 APP或软件名称:_。 如:50 微信 新知讲解 随堂练习 序号录制者姓名采用的语音识别出正确的文字数量准确率 1普通话 方言 2普通话 方言 3普通话 方言 4普通话 方言 课堂总结 1、语音识别的过程分为:声音数字化、信号预处理、特征提取、 模式匹配、语音处理。 2、语音识别的工作原理:通过软件开发工具包把声音传送到平台 识别,并返回结果。 板书设计 一、语音识别的过程 二、语音识别的实践 https:/ 浙教版信息技术八年级下第三单元第浙教版信息技术八年级下第三单元第 1111 课语音识别技术教学设计课语音识别技术教学设计 课题 第 11 课 认识人工智能单元第三单元学科信息技术年级
8、八年级 学习 目标 1、通过体验语音识别过程,了解声学模型和语音模型。 2、借助人工智能开放平台,实现将语音转换成文本,并了解影响声音识别的因素。 重点通过体验语音识别过程,了解声学模型和语音模型。 难点借助人工智能开放平台,实现将语音转换成文本,并了解影响声音识别的因素。 教学过程 教学环节教师活动学生活动设计意图 导入新课同学们,观看下面这副图,微信里有这个功 能,你认为它什么用处呢? 观看视频 语音识别视频 语音识别录入比打字快 3 倍 语音识别是以语音为研究对象,通过语音信号处 理 和模式识别让机器自动识别和理解人类口述的语 言。 听讲,思考 通过网上初步了 解语音识别。 讲授新课 一
9、、语音识别的过程 语音识别基本过程:通过数模转化得到一个 数字声音信号,对该声音信号进行预处理和特征 提取,将该特征在声学模型中进行模式匹配得到 音素序列,最后在语言模型中查找该音素序列匹 了解、掌握 通过教师讲解了 解语音识别的过 程。 配概率最高的文本,并输出识别结果。语音识别 过程如图 11-1 锁定所示。 语音识别原理是什么呢? 欣赏视频 1.声音数字化 声音数字化是指对于连续变化的声音物理信 号,每隔一段时间,测得模拟信号的电压值,给 出该电压值相应的量化值,并在计算中用 0 和 1 表示。通过声卡将模拟信号转换为数字信号。声 音数字化过程如图 11-2 所示。 2.信号预处理 信号
10、预处理是指对语音信号进行降噪、消除 杂音等处理后得到一个比较干净的语音信号。 3.特征提取 特征提取就是每隔一定时间,把声音的音调、 音长等特征提取出来的过程。 了解及掌握。通过学习,了解 语音识别的原理。 4.模式匹配 模式匹配就是将提取出来的特征在声学模型 中进行比对,得到一组音素序列。音素是根据语 音的自然规律划分出的最小语音单位。汉语拼音 中的“a、b、p”等可视为一个个音素。例如 “国家”这个单词包含“g、uo、j、i、a”这些音 素。把音素按照语言规律组合起来,就构成了每 个单词的发音。 知识链接: 声学模型:通过采集成千上万个人的发音样 本,提取每个单词所包含音素的发音特征,形成
11、 声学模型。由于普通话和地方方言的发音特征不 同,因此根据样本的语言,可形成不同的声学模 型。同一发音在不同模型中识别的效果是不一样 的。 .语言处理 语音处理是指根据匹配到的音素序列,在语 言模型中找到概率最高的文本并输出识别结果。 不同单词之间的搭配,在语句中出现的概率 是不一样的。常用的词语出现概率会比其他的更 高,也会被优先输出。单词的搭配还应该符合语 言习惯,如“起床上学”比“上学起床”出现的 概率更高。 知识链接: 自行网上了解 学生通过网上搜 索活动了解语音 处理的工作过程。 语言模型:对搜集到的海量语句进行分析统 计,获得单词之间搭配的概率关系,从而形成语 言模型。 二、语音识
12、别的实践 百度、腾讯等人工智能开放平台集成了大量 的声学模型和语言模型。通过这些平台提供的软 件开发工具包,可以把录制的声音传送到平台进 行识别,并返回识别结果。例如,利用百度语音 识别软件开发工具包,可以识别已录制的 myaudio.wav 文件中的语音信息,部分识别程序如 图 11-3,识别过程及结果如图 11-4 所示。 亲身体验: 尝试在其他人工智能开放平台、APP 或相关 软件中,将录制的 myaudio.wav 文件转换成文本。 日积月累 体验尝试将录制的语 音进行转换。 语音识别的准确率与声学模型和语言模型密 切相关。如果声学模型是用普通话训练的,那么 识别方言语音的准确率就相对
13、较低。通过及时更 新地名、网络流行语等词汇,在语言模型中改变 单词之间的搭配概率,可以有效地提高新单词的 识别率。语音识别的准确率还与录音时周边环境 的噪音、录声设备的质量等因素有关。 随堂练习 1.想一想:你在哪里见过语音识别的应用? 车载导航、语音搜索、曲目识别、家电遥控 等。 2.录制一段语音,在人工智能开放平台、 APP 或软件中,将录制的语音分别转换成文本, 并统计转换后文本的准确率。 录制的语音文件名:_如:语音识别. mp3 _, 包含文字(不含标点)的数 量:_120_个 2.选择不同的“发音人”或方言对同一段 文本信息进行录制,然后在统一平台、APP 或软 件中进行测试,并统计识别的准确率。 文本信息中包含文字(不含标点)的数量:_ 个。平台、APP 或软件名称:_。 课堂小结1、语音识别的过程分为:声音数字化、信号 预处理、特征提取、模式匹配、语音处理。 2、语音识别的工作原理:通过软件开发工具 包把声音传送到平台识别,并返回结果。 提问回答 通过提问方式进 行总结。 板书一、语音识别的过程 二、语音识别的实践
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。