1、讯 飞 超 脑 从感知智能到认知智能讯飞研究院 胡郁2015年3月22日19:46:14人工智能成为信息技术革命热点人工智能成为信息技术革命热点什么时候人工智能将实现革命性突破?人工智能 威胁派霍 金:“人工智能不一定是好事,或导致人类灭亡。”比尔盖茨:“人工智能让我很担忧”马斯克:“我们需要万分警惕人工智能,它们比核武器更加危险!”人工智能 理智派Facebook人工智能负责人Yann LeCun人工智能还远未达到能够威胁人类的地步,还有很多技术探索工作要做。机器学习大神Michael Jordan大量的人工智能业内人士奇点理论雷库茨魏尔:“奇点”到来之际,机器将自我完善,超越人类,从而开启
2、一个新的时代。人类智能的”奇点“是如何突破的?七万年前,从非洲大陆走出来的智人实现了“奇点”的突破,占领了整个世界人类简史:从动物到上帝线性增长Sigmoid曲线增长指数增长 瓶颈线(物理、经济、社会限制)奇点线2奇点线1时间技术水平n除了奇点,我们可能还会遭遇瓶颈。除了奇点,我们可能还会遭遇瓶颈。n问题:奇点线在瓶颈线下方,还是上方?问题:奇点线在瓶颈线下方,还是上方?人工智能的“奇点”会不会到来?人工智能成为信息技术革命热点我们如何才能实现这样的突破?人工智能之路如何实现(一)?如果计算机可以完全模仿人类大脑的神经活动,是不是就可以产生和人的智能类似的功能?欧 盟“人类大脑项目”奥巴马政府
3、推动“大脑活动图谱计划”我国积极酝酿启动“中国脑计划”人工智能之路如何实现(二)?n深度神经网络与大数据的结合突破了模型的界限n知识工程的实施将人类知识转化为计算机可理解人工智能成为信息技术革命热点 人工智能的发展 到哪儿了?人工智能现在到哪儿了?如果比计算能力和记忆能力,人类早已经不是机如果比计算能力和记忆能力,人类早已经不是机器的对手!器的对手!人工智能现在到哪儿了?从感知的角度来说,机器进步很快,与人类越来从感知的角度来说,机器进步很快,与人类越来越接近!越接近!人工智能现在到哪儿了?语言的使用区分了人与动物,也将是人工智能最语言的使用区分了人与动物,也将是人工智能最大的挑战!大的挑战!
4、回头再来看看“智人”吧让智人能够主宰地球的,是他们特殊的语言和“认知革命”名称名称新能力新能力更深远的影响更深远的影响河边有只狮子能够传达更大量关于智人身边环境的信息规划和执行复杂的计划,像是躲开狮子、猎捕野牛八卦能够传达更大量关于智人社会关系的信息组织更大、更有凝聚力的团体,规模可达150人虚构故事能够传达关于虚构概念的信息,例如部落的守护神、国家、有限公司及人权1.大量陌生人之间的合作2.社会行为的快速创新人类简史:从动物到上帝 人工智能也需要“认知革命”人工智能人工智能 自然语言理解自然语言理解Yann LeCunMichael Jordan深度学习的下一个前沿课题是自然语言理解如果有一
5、笔10亿美金的资助,我会将它用于自然语言处理的研究,比如“问答系统”人工智能的不断演进计算智能感知智能认知智能能存会算能听会说、能看会认能理解会思考讯飞超脑的规划技术愿景:从“能听会说”到“能理解会思考”目标:实现高可用的感知智能,让机器有更多感知能力 任务:包括语音识别、手写识别、图像识别等感知智能 目标:实现认知智能的突破,部分取代人类的脑力劳动 任务:包括智能客服、自动阅卷、人机交互等认知智能讯飞超脑的感知智能研究进展语音识别、手写识别等错误率保持每年3050%相对下降n讯飞研究院正在不断挑战更具难度的感知智能新任务普通话语音识别语音听写人人之间语音转写纸笔试卷手写识别在线单字手写识别方
6、言语音识别讯飞超脑的认知智能研究目标目标:让机器“能理解会思考”语言理解知识表示联想推理自主学习感知智能 vs.认知智能政治体育金融教育娱乐医疗餐饮科技通讯原始文本文本分类像素边界部件人脸识别中国两会圆满闭幕受到国际社会高度评价观测层“两会”是“全国人民代表大会”和“中国人民政治协商会议”的简称。每年3月份先后在北京人民大会堂召开召开全体会议,习近平、李克强等国家领导人都会参加这个会议。两会文本只是symbol,文本下隐含了大量知识任务层观测层深浅感知智能:对冗余信息进行抽象获得分类标签认知智能:对词汇标签进行知识填充获得语义讯飞超脑的认知智能研究规划传统自然语言处理技术路线:采用词典、依存语
7、法分析、依存语义分析、知识图谱、规则推理等技术方案实现人工神经网络技术路线:通过将词语和句子映射到语义空间,并通过语义空间的运算来实现推理等认知智能两种技术路线并行和相互借鉴的方式开展认知智能的研究,并按照词、句子、篇章的三步走方式推进,目前已取得多方面的阶段性进展n基于Word Embedding的连续语义空间表达DNN给自然语言理解带来新机遇词语层面研究最新进展nTOEFL考试中的近义词语义的细致辨析词语层面语义理解的标准测试之一测试词语基本不在词表中,无法用近义词词表解决Google的Tom Mikolov提出的Skip Gram当前主流的词语语义模型系统系统正确率GoogleGoogl
8、eSkip GramSkip Gram75.0iFLYTEKiFLYTEKSemantic Word Semantic Word EmbEmb.82.582.5句子层面研究最新进展n传统语音识别算法缺乏对语义信息的有效使用我(做/坐)了差不多一个半小时的火车累坏了我(做/坐)了差不多一个半小时的作业累坏了n基于Sentence Embedding的语义语言模型,可以针对一个句子的语义合理性进行判断识别结果语音输入语义模型语音识别的整句正确率和可懂度额外提升20%以上篇章层面研究最新进展n作文自动评分任务539.5篇章层面研究最新进展作文自动评分特征字迹工整度词汇丰富性局部通顺性句法正确性篇章结
9、构立意文采物理特征内容深度表示作文长度、段落数OCR 概率词汇的丰富性、词频、词汇的等级N-gram语言模型、N-gram词性序列模型是否有语病修辞手法、名人名言(包括谚语)连贯性、整体性、篇章结构中心思想是否集中、是否离题语义的分布式表示任务类型任务类型人机相关度人机相关度专家之间相关度专家之间相关度中考英语纸笔考试作文评分0.930.92大学英语四六级考试作文评分0.870.83高考作文纸笔考试评分0.940.96n日本Todai高考机器人日本国立情报学研究所目标:让机器人考入东京大学美国考试机器人 华盛顿大学图灵中心 目标:通过美国高中生物考试如何评价认知智能综合的水平?863计划“基于
10、大数据的类人智能”认知智能l 以深层语义理解、知识推理为特征l 新一代的类人智能关键算法 感知智能l 以模式识别、浅层理解为特征l 以大数据和云计算为支撑作文:根据以下材料,自选角度,自拟题目,写一篇不少于800字的文章(不要写成诗歌)你可以选择穿越沙漠的道路和方式,所以你是自由的;你必须穿越这片沙漠,所以你又是不自由的。人工智能通过高考有多难?原文:原文:“故宫太和殿是永乐以前全城最高的建筑,是帝王的象征,而祈年殿比太和殿还高出3米,成为天帝的象征。”题目:题目:下列理解,符合文意的一项是 A天坛的建筑风格是以气势高耸、铺天盖地取胜。B故宫太和殿是明清两代北京的最高建筑,是帝王的象征。C天坛的大量圆形建筑表现了中国古人生生不息的宇宙观。D天坛的琉琉瓦采用蓝色,与蓝天相互融合,虚实相生智人的将来基因工程生化人工程讯飞超脑19:46:28谢谢!