人工智能现状与未来课件.pptx_163文库

资源描述

1、人工智能的现状与未来网经科技刘继明精品课件人工智能概述第一节深度学习与智能围棋第二节人工智能3.0第三节目录 content精品课件人工智能的新革命第一节人工智能简述深度学习算法知识图谱精品课件人工智能将引领人类第四次工业革命智能化时间18世纪末工业1.0创造了机器工厂的“蒸汽时代”20世纪初电力广泛应用蒸汽机信息物联系统1970年代初今天工业2.0将人类带入分工明确、大批量生产的流水线模式和“电气时代”工业3.0应用电子信息技术，进一步提高生产自动化水平自动化、信息化工业4.0开始应用信息物理融合系统（CPS）复杂度互联网时代人工智能机器人交通工具（即无人机、无人驾驶等）VR（虚拟现

2、实）精品课件AI将催生“无用阶层”吗？精品课件什么是人工智能(AI)?全面实施战略性新兴产业发展规划，加快人工智能等技术的研发和转化，做大做强产业集群把发展智能制造作为主攻方向，推进国家智能制造示范区、制造业创新中心建设人工智能：国家战略(2017年政府工作报告)人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能是对人的意

3、识、思维的信息过程的模拟。人工智能不是人的智能，但能像人那样思考、也可能超过人的智能。什么是人工智能？人工智能有那些类型？弱人工智能，包含基础的、特定场景下角色型的任务，如Siri等聊天机器人和AlphaGo等下棋机器人；通用人工智能，包含人类水平的任务，涉及机器的持续学习；强人工智能，指比人类更聪明的机器；精品课件195619741980198719932006AI的诞生1956达特矛斯会议，“人工智能”正式诞生孕育期电子计算机机器翻译与NLP 图灵测试计算机下棋早期神经网络搜索式推理聊天机器人乐观思潮所有的AI程序都只是“玩具”运算能力计算复杂性常识与推理专家系统知识工程五代机

4、神经网络重生未达预期削减投入摩尔定律统计机器学习AI广泛应用大数据计算能力应用增多深度学习人工智能2016人工智能发展历程精品课件手机中的AI精品课件人工智能相关技术刚刚越过曲线高峰（处于狂热期），是推动透明化身临其境体验技术发展的主要动力涉及透明化身临其境体验的人本技术（如智能工作空间、互联家庭、增强现实、虚拟现实、脑机接口）是拉动另外两大趋势的前沿技术数字平台在曲线上处于快速上升期，其中的量子计算和区块链将在今后510年带来变革性的影响AI处于什么阶段？精品课件AI Roadmap精品课件国人为什么要关注AI？精品课件为什么人类能成为地球的主宰？基因：人和大猩猩的基因，有98.4%

5、都是完全一样的，只有1.6%有区别“符号语言”（口头语言和书面文字）：传递、保存、共享知识“集体知识”：人类的大脑可以相互共享信息，交换知识人类个体比其他动物没有多大优势，掌握了符号语言，人类社会的结构发生了突变，有了一个连接在一起的集体大脑。这种物种之间相互关联、相互作用的方式，才是我们和其他物种的真正区别脑容量：历史上的“尼安德特人”和我们的祖先脑容量是一样的。但后来尼安德特人就没留下来，只有我们这一支留下来了知识和创新是推动人类发展的动力精品课件AI学科结构常常识识性性推推理理演演绎绎、问问题题求求解解逻逻辑辑心心理理学学知知识识的的模模型型化化和和表表示示认认识识论论心心理理学学A A

6、I I系系统统和和语语言言系系统统程程序序设设计计计计算算机机语语言言启启发发式式搜搜索索现现代代控控制制理理论论图图论论运运筹筹学学基基本本方方法法和和技技术术近近期期主主要要应应用用领领域域近近期期主主要要应应用用领领域域信信息息处处理理心心理理学学逻逻辑辑控控制制理理论论心心理理学学语语言言学学自自然然语语言言系系统统声声学学语语音音学学机机器器视视觉觉光光学学模模式式识识别别心心理理学学图图示示学学机机器器人人工工业业自自动动化化控控制制理理论论空空间间研研究究自自动动程程序序设设计计系系统统程程序序设设计计算算法法分分析析计计算算原原理理逻逻辑辑自自动动定定理理证证明明数数学学逻

7、逻辑辑学学教教学学、科科学学和和工工程程辅辅助助博博弈弈管管理理科科学学有有关关学学科科符符号号操操作作图图示示学学精品课件AI的几大门派符号学派联结学派行为学派神经网络知识表示机器人模拟人的心智模拟脑的结构模拟人的行为聪明的AI有学识的AI深度学习深度学习知识图谱知识图谱感知识别判断思考语言推理贝叶斯学派进化学派类推学派精品课件人工智能产业生态的三层基本架构u基础资源层基础资源层：主要是：主要是计计算平台算平台和和数据中心数据中心，属于，属于计算智能；计算智能；u技术层技术层：通过机器学习：通过机器学习建模，开发面向不同领域建模，开发面向不同领域的的算法算法和和技术技术，包含，包含感知感知智

8、能智能和和认知智能认知智能；u应用层应用层：主要实现人工：主要实现人工智能在不同场景下的应用。智能在不同场景下的应用。基础资源支基础资源支撑撑AI生态逐步形成：基础资源+技术+应用精品课件人工智能系统的技术架构智能终端智能云平台精品课件人工智能的新革命第一节人工智能简述深度学习算法知识图谱精品课件推理期知识期机器学习期人工智能的三个研究阶段1950s1970s1980s基于符号知识表示通过演绎推理技术基于符号知识表示通过获取和利用领域知识建立专家系统神经网络第二个高潮 NP(non-deterministic polynomial-time)难题中获重大进展助力大量现实问题神经

9、网络第一个高潮期神经网络以深度学习之名再次崛起大幅提升感知智能准确率201790s中期统计学习登场并占据主流，支持向量机、核方法为代表性技术提出支持向量、VC维等概念统计学的研究成果经由机器学习研究，形成有效的学习算法联结学派对大脑进行逆向分析灵感来自于神经科学和物理学产生的是“黑箱”模型神经网络可归置此类符号学派将学习看作逆向演绎并从哲学、心理学、逻辑学中寻求洞见代表包括决策树和基于逻辑的学习机器学习&深度学习从以“推理”为重点到以“知识”为重点，再到以“学习”为重点机器可以自动“学习”的算法，即从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。目前，机器学

10、习=“分类”人工智能机器学习深度学习精品课件深度学习是使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法深度学习是一种基于对数据进行表征学习的方法。观测值（例如一幅图像）可以使用多种方式来表示，如每个像素强度值的向量，或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务（例如，人脸识别或面部表情识别）。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征用数据优化计算机程序的模型参数通过经验自动改进的计算机算法深度学习算法简介：机器学习机器学习的基本定理模型的出错率推论：模型复杂-大

11、样本样本小-简化模型)(xFxyClass label(Classification)Vector(Estimation)精品课件机器学习实施过程特征提取特征1样本数据样本数据样本数据n预处理特征样本集原始样本集机器学习算法训练预测输出验证集评价目标特征1n目标特征1n目标特征1n训练集目标特征1n目标特征1n目标特征1n验证集目标特征1n目标特征1n目标预测目标预测目标预测目标改进精品课件特征提取特征提取特征1样本数据样本数据样本数据n特征样本集原始样本集目标特征1n目标特征1n目标统计分析变换特征运算精品课件特征选取是成败的关键人脑是通过分级的、多层网络模型来识别减少数据量，保留物体的有

12、用信息低层信息预处理特征提取识别分类对效果影响极大手动化特征工程非常耗时图像识别的一般流程人脑识别图像的过程精品课件第一个模型是一个线性模型，低度拟合，不能很好地适应训练集；第三个模型是一个四次方的模型，过度拟合，虽然能非常好地适应我们的训练集，但在新输入变量进行预测时可能会效果不好；中间的模型似乎最合适经过算法预测的结果是一个连续的值，我们称这样的问题为回归问题。算法能够学会如何将数据分类到不同的类里，我们称这样的问题为分类问题。深度学习算法简介：数学基础精品课件当感知器用于两类模式的分类时，相当于在高维样本空间中，用一个超平面将两类样本分开神经网络的学习过程就是神经网络参数的设定

13、过程一个神经元网络结构确定之后，需要对一系列参数（权重、阈值等）进行有效的设定。这个过程叫做学习或训练过程，此时的方法叫学习算法是一个由线性阈值元件组成的单层（或多层）神经元的神经网络当输入的加权和大于或等于阈值时，输出为1，否则为0 模型假定神经元中间的耦合程度（即加权系数W）可变，这样，该模型可以学习深度学习算法简介：感知器精品课件监督学习通过已有的训练样本（即已知数据以训练样本（即已知数据以及其对应的输出）训练及其对应的输出）训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实

14、现分类的目的，从而也就具有了对未知数据进行分类的能力各种神经网络类型LogisticRBMAuto EncoderSparse CodingConvolutional（卷积）强化学习类似人类与环境交互的方式，智能系统从环境到行为映射的学习，以使奖励信号函数值最大。环境对环境对产生动作产生动作的的好坏通过奖励好坏通过奖励信号信号作评价作评价，而不是告诉强化学习系统如何去产生正确的动作。强化强化学习学习不能立即得到标记，不能立即得到标记，而只能得到一而只能得到一个反馈个反馈，因此可以说强化学习是一种具有“延迟标记信息”的监督学习典型案例典型案例：AlphaGo深度学习的训练方法2006年，Geof

15、frey Hinton在科学上发表论文提出深度学习主要观点：多隐层的人工神经网络具有优异的特征学习能力，学习得到的特征对数据有更本质的刻画，从而有利于可视化或分类深度神经网络在训练上的难度，可以通过“逐层初始化”（layer-wise pre-training）来有效克服，逐层初始化可通过无监督学习实现的在著名的ImageNet问题上将错误率从26降低到了15，并且输入没有用到其他任何人工特征，仅仅是图像的像素迁移学习将从拥有大数据的源领域上学习到的东西应用到仅有小数据的目标领域上去，实现个性化迁移，即举一反三、触类旁通。典型典型案例案例：斯坦福学者使用卫星图像获取的灯光信息来分析非洲大陆

16、的贫穷情况精品课件深度学习的神经网络训练方法LeNet-5：卷积神经网络手写数字识别的应用卷积过程包括：用一个可训练的滤波器fx去卷积一个输入的图像，然后加一个偏置bx，得到卷积层Cx。子采样过程包括：每邻域四个像素求和变为一个像素，加权再增加偏置，通过一个激活函数，产生一个缩小四倍的特征映射图C1层：输入图片大小：32*32卷积窗大小：5*5卷积窗种类：6输出特征图数量：6输出特征图大小：28*28(32-5+1)神经元数量：4707 (28*28)*6)连接数：12304(5*5+1)*6*(28*28)可训练参数：156(5*5+1)*6精品课件精品课件局部感受-卷积FeatureMap

17、精品课件池化原理：根据图像局部相关的原理，图像某个邻域内只需要一个像素点就能表达整个区域的信息常见的方法：最大值池化（max-pooling）L2池化（L2 pooling）均值池化（Mean Pooling）精品课件LeNet-5 Yann Lecun,1989年用美国邮政系统提供的近万个手写数字的样本来训练神经网络系统，在独立的测试样本中,错误率只有5%进一步运用CNN，开发出LeNet-5用于读取银行支票上的手写数字，这个支票识别系统在九十年代末占据了美国接近20%的市场精品课件深度学习的训练方法 Hinton in ImageNet 比赛 140万图像，1000类图库 1000万

18、图像 20000类 7层CNN 准确率74%-85%精品课件深度学习的成功应用 AlphaGo战胜李世乭图像识别全面超越人类语音识别接近人类将声学模型中混合高斯模型替换为DNN模型获得30%+相对提升 Tesla Autopilot投入商用 Google Translate投入商用它把原文例如中文词先翻成一个词向量，变成一个数字向量。它对这个词向量再编辑，变成一个语义表示的方式。再把它翻译成它的目标语言，例如英文。精品课件人工智能的新革命第一节人工智能简述深度学习算法知识图谱精品课件知识图谱(Knowledge Graph)知识图谱旨在描述真实世界中存在的各种实体或概念及其关系

19、，一般用三元组表示知识图谱亦可被看作是一张巨大的图，节点表示实体或概念，边则由属性或关系构成中国国家美国日本英国北京9,634,057平方公里13.5404亿2069.3万北纬3856东经116203.1525亿华盛顿9,629,091平方公里北纬3853西经7702178平方公里16410平方公里1.26亿377835平方公里东京2188平方公里东经14050北纬3544面积人口首都纬度经度面积人口精品课件知识图谱构建WebWeb字典字典,术语表术语表,百科百科,书本书本知识获取+已有知识库知识融合知识验证知识图谱名称规模Yago1千万实体，35万类别，1.8亿事实，100种属性，100

20、语言Dbpedia4千万实体，250类别，5亿事实，6000种属性，Freebase2千5百万实体，2000主题，1亿事实，4000种属性谷歌知识图谱5亿实体名字，35亿条事实NELL3百万实体名字，300类别500属性，100万事实1千5百万学习规则精品课件基于人工规则的语义理解神话是孙楠和谁合唱的？文法解析知识库查询SPARQL查询语句生成答案生成孙楠和韩红合唱了神话韩红歌手 6万歌曲 260万专辑 44万标签 2000类param:singer孙楠#param:song神话#predicate:chorusWith神话是孙楠和谁合唱的查询神话这首歌曲的演唱者，演唱者要包括孙楠，输出还包括

21、的另外一个演唱者文法规则模板歌手 6万歌曲 260万专辑 44万标签 2000类互联网各种音乐相关信息下载融合精品课件知识图谱的成功应用：现代搜索引擎半结构化信息半结构化信息抽取抽取半结构化数据半结构化数据结构化数据文本数据文本数据实体对齐推理补充数据推理补充数据异构数据整合重要度计算重要度计算实体抽取属性实体抽取属性抽取抽取属性值决策关系建立知立方数据本体本体生成系统生成系统索引生成检索系统实体识别实体识别本体库PatternPattern挖掘挖掘标签消岐标签消岐SPARQL查询语句排序排序推理推理推荐推荐统计统计Query展现展现检索系统检索系统索引生成索引生成精品课件面向知识图谱的Sog

22、ou搜索技术精品课件Gene OntologyLOD企业对知识图谱根据内部数据有大量的业务需求从两方面来建设知识图谱体系:知识实体，算法企业知识图谱的建立精品课件语义理解智能检索与问答数据关联探索业务动态扩展非结构化数据计算机难以理解数据使用专业程度过高多元异构数据难以融合数据模式动态变迁困难结构化数据数据融合自由扩展数据模式行业智能问答业务需求技术方案数据挑战知识图谱助力企业商业智能精品课件通用知识图谱+行业知识图谱l 通用知识图谱的广度，行业知识图谱的深度，相互补充，形成更加完善的知识图谱l 通用知识图谱中的知识，可以作为行业知识图谱构建的基础；而构建的行业知识图谱，再融合到通用知识图谱

23、中通用知识图谱行业知识图谱通用知识图谱创投创投专利专利精品课件深度学习与智能围棋第二节从AlphaGo Lee/Master讲起蒙特卡洛树式搜索 AlphaGo的实现原理 AlphaGo Zero精品课件01人机大战：深度学习算法的标志性成果最复杂（注：状态复杂度与博弈复杂度）的智力游戏：看似简单，实为复杂，具有10的170次方状态复杂空间涉及逻辑推理，形象思维，优化选择等多种人类智能（注：国际象棋只有逻辑推理，没有形象思维）02接近人类公认是人工智能领域长期以来的重大挑战03标志性国际学术界曾经普遍认为解决围棋问题需要15-20年时间04挑战为什么做围棋AI？精品课件创新性投入力度业内

24、龙头目前技术优势：起步早，算法新，技术强，资源雄厚最近一年专注于强化学习研究拟于近期公布新论文和数据，并从此退出围棋AI领域Google Deepmind 简介精品课件精品课件深度学习与智能围棋第二节从AlphaGo Lee/Master讲起蒙特卡洛树式搜索 AlphaGo的实现原理 AlphaGo Zero精品课件传统围棋AI算法 MCTS（蒙特卡洛树搜索）双人一人一步双方信息完备（棋类完全信息,牌类不完全信息）零和动态博弈问题计算机下棋棋类要素的数字化恰当的数据结构棋盘、棋子、棋规（着法规则，胜负规则）用着法推演局面博弈树展开从有利局面选择当前着法博弈搜索局面评估指标

25、定义与综合精品课件展开深度为4的博弈树本方本方本方本方本方本方对方对方对方对方Ply 1Ply 3Ply 4Ply 2Ply 0根节点为当前局面叶节点为展开终点双方轮流出手偶数层为本方奇数层为对方精品课件围棋落子蒙特卡洛数学模型及评估围棋对弈过程可以看做一个马尔科夫过程：五元组：T，S，A(i)，P(|i,a)，r(i,a)T：决策时刻 S：状态空间，S=i A(i)：可行动集合（可落子点）P(|i,a)：状态i下选择行动a的概率 r(i,a)：状态i下选择行动a后课获得的收益从当前局面的所有可落子点中随机（或者给胜率高的点分配更多的计算力）选择一个点落子重复以上过程直到胜负可判断为

26、止经多次模拟后（计算越多越精确），选择胜率最大的点落子精品课件传统围棋AI算法数学模型 MCTS（蒙特卡洛树搜索）基本思想与特点：-将可能出现的状态转移过程用状态树表示-从初始状态开始重复抽样，逐步扩展树中的节点-某个状态再次被访问时，可以利用已有的结果，提高了效率-在抽样过程中可以随时得到行为的评价选择-从根节点出发自上而下地选择一个落子点扩展-向选定的点添加一个或多个子节点模拟-对扩展出的节点用蒙特卡洛方法进行模拟回溯-根据模拟结果依次向上更新祖先节点估计值精品课件深度学习与智能围棋第二节从AlphaGo Lee/Master讲起蒙特卡洛树式搜索 AlphaGo的实现原理 Alph

27、aGo Zero精品课件1313个卷积层，每层个卷积层，每层192192个卷积核，个卷积核，每个卷积核每个卷积核3 3*3 3，参数个数，参数个数800800万万+GPU 3ms/GPU 3ms/步步预测准确率预测准确率 57%57%Policy Policy NetworkNetwork（策略网络）（策略网络）在每个分支节点直接判断形势在每个分支节点直接判断形势与与RolloutRollout随机模拟相结合，互为补充随机模拟相结合，互为补充Value NetworkValue Network（价值网络）（价值网络）给胜率高的点分配更多的计算力给胜率高的点分配更多的计算力任意时间算法，计算越多

28、越精确任意时间算法，计算越多越精确1 1、选取、选取 2 2、展开、展开 3 3、评估、评估 4 4、倒传、倒传MCTSMCTS（蒙特卡洛树搜索）（蒙特卡洛树搜索）通过随机模拟走子胜率来判定形势通过随机模拟走子胜率来判定形势速度很快（速度很快（1ms/1ms/盘）盘）随机性与合理性的平衡随机性与合理性的平衡RolloutRollout（随机模拟走子）（随机模拟走子）AlphaGo的实现原理控制宽度（250）控制深度（150）基本算法快速模拟围棋是完全信息博弈，从理论上来说可以通过暴力搜索所有可能的对弈过程来确定最优的走法精品课件Policy Network策略网络：落子棋感深度神经网络的有监

29、督学习，目标是获得在围棋盘面下的落子棋感学习职业棋手和业余高段棋手的棋谱（数十万份棋谱，上亿数量级的落子方式）把当前局面作为输入，预测下一步的走棋。它的预测不只给出最强的一手，而是对棋盘上所有可能的下一着给一个分数用Policy Network作为第一感，将计算力分配到最有希望的选点分枝数从上百个减少到几个优先计算PolicyNetwork分数高的点，计算力充沛时，适当分配到其他分值较低的点精品课件PolicyNetwork输入特征32242485521282721921321921321281322048 20482048 204819232192321283248523112192

30、3219232192132192132128132128272485248552128321000局部感知域权重共享特征训练卷积层+池化层模型结构 13个卷积层，每层192个3*3卷积核数百万个参数训练数据 KGS 6d以上对局，17万，职业对局8万。训练数据量5000万+训练时间几十天运算速度 GPU，3ms 预测准确率 57%精品课件左右互博，自我进化 Agent通过和环境s的交互，选择下一步的动作a，这个动作会影响环境s，给Agent一个reward，Agent然后继续和环境交互。根据游戏结果迭代更新转移概率和评估函数神经网络结构与策略网络相同训练方法：自我对局目标：校正价

31、值导向将策略网络权值作为初始值，自我对弈更新权值，从而提升棋力 Pros:棋艺更高(win 80%of the games with SL policy network)Cons:走法集中，不适应MCTS多搜索范围的需求强化学习(RL)精品课件Fast-Rollout 快速走子 Rollout（随机模拟走子）通过随机模拟走子胜率来判定形势速度快随机性，合理性的平衡原因：1.策略网络的运行速度较慢(3ms)快速走子在2us 2.用来评估盘面。在同等时间下，模拟走子速度快乃至使用随机走子，虽然单次估值精度低，但可以多模拟几次算平均值，效果未必不好。提升棋力结构：局部特征匹配+线性回归特

32、征：围棋专业知识精品课件Value Network：胜负棋感深度神经网络的增强型学习（DeepMind独创）通过自我博弈，学习不同盘面下的胜负情况（三千万盘自我对局）获取在围棋盘面的胜负棋感（注：对每一个落子点给一个当时的快速的胜负感（估算），这个胜负估算并不是根据分析计算出来的，而是直觉）（通过AlphaGo几千万盘的训练学习得来的）形势判断：-1：白棋必胜0：黑棋优势1：黑棋必胜精品课件Value Network 模型模型结构 13个卷积层，每层192个卷积核，每个卷积核3*3 数百万个参数训练数据 Policy Network自我对弈棋谱。3000万+特定盘面+胜负结果训练时间几

33、十天运算速度 GPU，3ms 方法：在每个分支节点，使用Value Network直接判断形势与Rollout随机模拟相结合，互为补充效果：职业水平，AlphaGo精品课件MCTS在对局中实时搜索Step 1：基于策略网络落子，可能性大的落子拓展节点Step 2：对未来走势进行评估，同时使用估值网络和快速走子，综合两者预测未来走法Step 3：评估结果作为下一步走法的Q值。重新模拟。Step 4：结合下一步走法的Q值和策略网络进行再一次模拟。如果出现同样走法，Q值起平均。新分数=调整后的初始分+0.5*通过模拟（策略网络+快速走棋)得到的赢棋概率+0.5*估值网络的局面评估分Step 5

34、：反复循环直到n次，或者timeout，选择被选择次数最多的走法作为下一步Put-Together精品课件深度学习与智能围棋第二节从AlphaGo Lee/Master讲起蒙特卡洛树式搜索 AlphaGo的实现原理 AlphaGo Zero精品课件AlphaGo Zero第3天，下了490万局棋，打败老大老三战绩老三学棋过程刚开始，随机下子热衷于吃子，完全不顾死活发现了如果先占住棋盘的边和角，后面占便宜学会了如何打劫、征子懂得看棋形第21天，败了老二第40天，完整走过了一个人类棋手学棋的全过程棋盘/黑子/白子棋子被围起来就死规则规则棋士柯洁 10月19日 02:22 一个纯净、纯粹

35、自我学习的AlphaGo是最强的.对于AlphaGo的自我进步来讲.人类太多余了老大AlphaGo Lee,2016年3月 4:1 打败韩国棋手李世石老二AlphaGo Master,2017年5月 3:0 打败中国棋手柯洁老三AlphaGo Zero,2017年10月宣布自学围棋40天，打败所有人精品课件AlphaGo Zero解析人类经验由于样本空间大小的限制，往往都收敛于局部最优而不自知（或无法发现），阿法元不再被人类认知所局限，而能够发现新知识，发展新策略区别1：特征提取层采用40个残差模块，每个模块包含2个卷积层。运用残差模块提升了网络深度，更深的网络能更有效地直

36、接从棋盘上提取特征区别2：同时训练走子策略(policy)网络和胜率值(value)网络启示深度学习训练过程需要消耗大量人类标注样本，而这对于小样本应用领域(比如医疗图像处理)是不可能办到的。所以减少样本和人类标注的方法非常重要开局和收官和专业棋手的下法并无区别，但是中盘难于理解；机器经验与人类经验有很大差别，我们又该如何去选择和利用呢？精品课件智能围棋与蒙特卡洛树搜索没有棋感直觉不行，完全依赖棋感直觉也不行直觉需要通过严格的数学模型和计算方法，对棋感直觉进行验证 AlphaGo使用蒙特卡洛树搜索，对落子棋感和胜负感进行计算验证。蒙特卡洛树搜索：搜索验证基于数学期望的胜负评估模型

37、（胜率）基于蒙特卡洛模拟进行胜负结果采样（模拟采样比直觉更可靠）根据模拟采样结果验证盘面胜负的数学期望可靠程度与采样规模相关（采样越大，离真理会更近些）蒙特卡洛模拟采样：胜负棋感验证精品课件智能围棋与神经网络谷歌的AlphaGo是深度学习算法的标志性成果；深度卷积神经网络(Deep Convolutional Neural Network,DCNN),是近年发展起来，并引起广泛重视的一种高效识别方法。围棋算法具有高度的复杂性和代表性（10808，两个30年）。由于天文数字的状态空间和搜索空间，蛮力计算无法解决围棋问题（注：解决国际象棋的IBM深蓝是用蛮力方法，就是靠计算，这种方法在围棋这么

38、大的计算与搜索空间是无法进行的）从围棋算法可以推广到深度学习应用的一般情形。围棋职业棋手的解决方法：棋感直觉+搜索验证 AlphaGo的核心方法完全类似于完全职业棋手的解决方法 AlphaGo的优势：完全以胜率为目标，不受任何其它因素影响精品课件直觉：不经过思考过程，很快就能出现的直接想法、感觉、信念或者偏好（这个非常重要，其强大的力量。如：落子的直觉，胜负的直觉、棋盘的直觉、棋形的直觉）通过深度神经网络和大数据的训练而获得人工智能的核心方法：直觉获取验证：为直觉建立真实性、准确性和可靠性的检验过程验证是核实直觉不存在偏差的一个充分条件由于廉价并行计算和大数据的支持，直觉可以通过搜索计

39、算来验证人工智能的核心方法：搜索验证人类生活面临一系列的抉择问题（注：有了直觉和验证就可以找一个最好的）A.手里的股票是持有还是抛售 B.驾驶员到交通灯前是左拐还是右拐直觉获取和搜索验证的结合使用，可以提供优化选择人工智能的核心方法：优化选择精品课件人工智能3.0第三节 AI技术的新特征 AI走向3.0 认知计算 AI3.0面对的挑战精品课件Q1：什么领域AI能够超过人？（完全信息博弈）充分的数据：需要有超级大的数据量，它不能举一反三，它要举多反三（完全信息博弈）信息具有确定性：数据是要有标注的，不是到网上弄一堆数据（完全信息博弈）完全信息：应用一定是单一领域，这个领域越垂直、越细越好。一

40、个人工智能客服的应用不可以用来做导游，应用单一、一定要非常清晰不跨领域有懂行的专家去选择有效的神经网络模型，调整各种网络参数需要超大计算量，机器容易甩开人类精品课件一只乌鸦的启示图b：找到了坚果，砸不开。它就发现一个诀窍，把果子放到路上让车轧过去图c：靠近红绿路灯的路口，车子和人有时候停下了。图d：选择了一根正好在斑马线上方的一根电线蹲下来图e：把坚果抛到斑马线上，等车子轧过去，然后等到行人灯亮了日本新喀乌鸦一个完全自主的智能。感知、认知、推理、学习、和执行。远远超过任何机器人，乌鸦向我们证明了，这个解存在。无大数据学习，无人工标注好的训练数据，没人教它乌鸦头不到人脑的1%大小。

41、人脑功耗大约是10-25瓦，它就只有0.1-0.2瓦启示精品课件Q2：AI+还是+AI？在AI技术成熟之前，这个行业、产品从未存在过。比如自动驾驶，亚马逊的Echo智能音箱、苹果的Siri语音助手。在人工智能技术未突破前，不存在这样的产品。因为AI，创造出了一条全新的产业链。AI+行业：从0到1 行业本身一直存在，产业链条成熟；以前完全靠人工，效率比较低，现在加入AI元素后，使得行业效率有了明显提高。比如安防、医疗等领域。行业数据控制比AI技术更重要，例如医疗+AI，最重要的是大量准确的被医生标注过的数据。在国内，医疗数据拿出来非常困难。行业+AI：从1到n AI应用需要积累足够的数据和经过充

42、分的学习才两个起作用当一个AI应用找到第一批用户时，他们使用的行为和记录被后台记录下来；开发者再对这种行为和记录进行迭代的改进，当再把该应用投向第二批用户的时候，其行为已经比第一代提升了涟漪效应精品课件容错容错生产力生产力成熟成熟封闭可控封闭可控数据数据Q3：什么AI项目容易成功？精品课件新特征1：深度学习+自我博弈进化技术精品课件p 与传统博弈人工知识不同，AlphaGo深度强化学习初步具备了“直觉感知（下一步在哪）”，“棋局推理（全局获胜机会如何）”，和“新颖落子（想人所不敢想）”等能力。p 将记忆人类棋局和自我博弈积累棋局结合起来。DeepMind算法减少了40%用于冷却的电量，即整体

43、用电量效率提升15%2010年全球数据中心电力消耗为2355亿度，约占全球电力消耗1.3%（美2%，中1.8%）。谷歌公司电力消耗低于全球数据中心的1%DeepMind已为谷歌挣钱 DeepMind的软件控制着数据中心的风扇、制冷系统和窗户等120个变量，使谷歌的用电效率提升了15%，几年内共为谷歌节约电费数亿美元。据ICTResearch统计：2015年我国数据中心能耗高达1000亿度，相当于整个三峡水电站一年发电量。精品课件p Science2016年1月1日发表 “群智之力量（The Power of Crowds,Vol.351,issues 6268）”的论文认为：结合群体智慧与机器

44、性能来解决快速增长难题。p 其将群智计算按难易程度分为三种类型：实现任务分配的众包模式（Crowdsourcing）、较复杂支持工作流模式的群（Complex workflows）以及最复杂的协同求解问题的生态系统模式（Problem solving ecosystem）.新特征2：基于网络的群体智能已经萌芽精品课件p 大规模个体通过互联网构架的参与，可以表现出超乎寻常的智慧能力，是解决开放复杂问题的新途径p 美国普林斯顿大学Connetome项目开发了EyeWire游戏，玩家对显微图像中单个细胞及其神经元连接按功能进行涂色。第一次提供了哺乳动物视网膜的神经元结构和组织如何产生检测运动的功能

45、。145个国家的165000多名科学家（玩家）参与p 成功的还有：苹果AppStore（130万个应用程序）、Wiki百科（4000万词条）等等美国普林斯顿大学Connetome项目通过群体参与来探讨大脑结构和功能之间映射的神经通路http:/www.humanconnectomeproject.org/（继续）精品课件p 各种穿戴设备、人车共驾、脑控或肌控外骨骼机器人、人机协同手术等实现生物智能系统与机器智能系统的紧密耦合。新特征3：人机一体化技术导向混合智能精品课件自然语言处理视觉计算听觉感知精灵宝可梦GO:AR:图形+视频谷歌：VR绘画应用Tilt Brush Facebook:视频

46、描述生成架构跨媒体间桥梁新特征4：跨媒体推理已经兴起在语言、视觉、图形和听觉之间语义贯通，是实现联想、推理、概括等智能的重要关键精品课件新特征5：无人系统迅速发展机械手在工业装配线上发展迅速在灵活运动的领域中，无人系统迅猛发展的速度远快于机器人因为人类或类动物的机器人，往往不如对机械进行智能化和自主化升级来得高效精品课件人工智能3.0第三节 AI技术的新特征 AI走向3.0 认知计算 AI3.0面对的挑战精品课件我们正在进入AI3.0时代人工智能基础理论和基础学科建立的阶段，AI的具体学科，比如语音识别、机器翻译、自然语言处理、视觉等被建立起来，并形成了人工智能从业的方法论及学派A

47、I1.0时代：1945-2005年以2006年谷歌翻译上线为标志的AI2.0时代，人工智能的发展从学术界到谷歌这样的公司主导，从以前的军用到民用，产品从ToB到大规模的ToC的过程人工智能技术被广泛用于各类智能产品之中算法（深度学习）+数据（大数据）+基础设施（计算能力）AI2.0时代：2006-2016年从软件到AI芯片，走向软硬结合从信息到服务崭新的、群雄逐鹿、百花齐放的时代AI3.0时代：2017-20 xx年精品课件浅层次动因：需求、环境和技术p 社会新需求爆发：n 智能城市、智能医疗、智能交通、智能游戏、无人驾驶、智能制造等等p AI的基础和目标巨变：n 大数据、多媒体、

48、传感器网、增强实现（AR）、虚拟实现（VR）等等n计算机模拟人的智能人机智能群体智能p 信息环境巨变：n 互联网、移动计算、超级计算、穿戴设备、物联网、云计算、网上社区、万维网、搜索引擎等等人工智能迈向新一代AI走向3.0的原因分析精品课件PHCPH深层次分析：世界正从原来的二元空间进入新的三元空间世界原来是二元空间:人类社会空间（H）和物理空间（P）。但近年来，信息力量的迅速壮大，已长成除P、H两极之外的新一极：信息空间（C）。精品课件信息来自于人类社会：书籍、交流、媒体、计算机信息开始互联：互联网、移动通讯和搜索信息绕过人类，直接来自于物理世界：传感器和物联网产生大数据：信息

49、快速膨胀，人类已无法单独处理从大数据必然会走向大知识，并推动人类认识与控制能力的大变化近50年来，信息空间成长壮大的历程从AI落后人类的原因看大知识（智能大数据）面临的挑战强在记忆能力和计算能力，但是自我学习、举一反三的能力还不如5岁孩子面对未知环境的变化，未知的任务，决策能力很弱AI智能学习与创新的能力：理解尤其是对整体环境的理解能力，可以通过经验来学习新事物，获得新知识，并具备触类旁通的能力对于信息（不完全信息，模糊信息）的分析和决策能力人类智慧大知识需要结合大数据资源和AI的神经网络、符号智能、知识挖掘、人机交互等技术结合起来，不仅解决可解释性、通用性问题，而且形成新技术，实

50、现新应用技术融合依靠大数据的深度学习和增强学习是AI当前最普遍成功的技术之一。但是，深度学习需要大量的标注数据，又是黑箱算法，其结果难以解释，而且只能专用，因为它和人类使用的知识形式差距太大AI技术现状精品课件从PH到CPH的人类空间演变并未结束，而正在深化。AI走向3.0正是这种深化演变为的一个结果AI2.0互联网多媒体、传感器人机交互自主装备大数据新一代人工智能自主智能系统群体智能智能大数据跨媒体智能人机混合增强智能AI走向3.0认知智能能理解会思考感知智能能听会说、能看会认计算智能能存会算新一代AI的技术方向精品课件p 空间变化带来了认知的新门类、新通道、新计算P物理空间C信息

展开阅读全文