1、大数据技术和标准化大数据技术和标准化2内内 容容 大数据发展背景 标准化工作现状 下一步工作重点3一、大数据催生了信息化一、大数据催生了信息化3.03.0(智慧化阶段)(智慧化阶段)信息化1.0-1995以单机应用为特征的数字化阶段-2015以联网应用为特征的网络化阶段2015-以数据的深度挖掘与融合应用为特征的智慧化阶段经历基础性变革后的未来信息技术支撑的信息化信息化2.0信息化3.0?金税工程金税工程n数据规模更大,来源更丰富,类型更复杂,变化更快4一、一、大数据催生了信息化大数据催生了信息化3.03.0(智慧化阶段)(智慧化阶段)技术廉价化、互联网发展、信息化建设长期积累,形成了规模巨大
2、的数据资源,且仍将加速增长大数据应用的成功案例,激发了基于数据,萃取知识、指导实践的巨大需求大数据大数据现象出现现象出现数据应用需求激增以数据的深度挖掘与融合应用为特征的智慧化智慧化阶段信息化信息化3.03.05二、二、大数据的战略意义大数据的战略意义大数据正在改变大数据正在改变人类的思维方式人类的思维方式随机样本精确求解因果关系全体数据近似求解关联关系传统思维大数据思维6二、二、大数据的战略意义大数据的战略意义GDP改善民生:改善民生:优化资源配置优化资源配置,健康医疗、就业、社保、教育、公共交通健康医疗、就业、社保、教育、公共交通产业转型,创新业态:产业转型,创新业态:颠覆传统产业颠覆传统
3、产业,提高运行效率和决策能力提高运行效率和决策能力,催生智能制造、催生智能制造、互联网金融等新业态互联网金融等新业态大数据时代,信息技术不仅是行业发展的大数据时代,信息技术不仅是行业发展的“倍增倍增器器”、“催化器催化器”,甚至会成为行业的颠覆者,甚至会成为行业的颠覆者7二、二、大数据的战略意义大数据的战略意义美国棱镜计划:美国棱镜计划:电邮、即时消息、视频、照片、语音、文件传输、视频会议、社交网络等数据的收集与综合分析自主可控的大数据技术体系是自主可控的大数据技术体系是不可或缺的基础!不可或缺的基础!8三、三、大数据产业生态链(技术)大数据产业生态链(技术)大数据采集大数据采集大数据存储、大
4、数据存储、管理和处理管理和处理大数据呈现大数据呈现和应用和应用大数据分析大数据分析和挖掘和挖掘9三、三、大数据产业生态链(商业)大数据产业生态链(商业)10四、四、我国大数据产业发展现状我国大数据产业发展现状基础设施和分析方法方面:主要依赖国外技术和产品,核心技术方面仍是学习者和追随者应用方面:BAT在网络大数据具有优势:网站、微博、微信、搜索、交易数据等,互联网企业的技术优势难以顺畅地扩散到各行业 部门、地方和一些行业开始关注大数据资源建设 初级发展阶段,缺少典型性、共识性强的大数据应用;数据资源开放方面:我国数据资源主要来源于互联网,业务、政务数据共享开放程度低 急需标准化,保证有序发展、
5、开放共享11内内 容容 大数据发展背景 标准化工作现状 下一步工作重点12一、大数据工作组概况一、大数据工作组概况(一)组织架构(一)组织架构 组长:组长:梅梅 宏宏 上海交通大学上海交通大学 副校长(院士)副校长(院士)副组长:副组长:车品觉车品觉 阿里巴巴集团副总裁阿里巴巴集团副总裁 吴建明吴建明 华为华为ITIT技术开发部部长技术开发部部长 杜小勇杜小勇 中国人民大学信息学院院长中国人民大学信息学院院长 秘书长:秘书长:高高 林林 工业和信息化部信软司工业和信息化部信软司 副司长副司长 联络员:联络员:刘大山刘大山 国家标准化管理委员会工业二部国家标准化管理委员会工业二部 处长处长 孙文
6、龙孙文龙 工业和信息化部信软司工业和信息化部信软司 处长处长 侯建仁侯建仁 工业和信息化部电子信息司工业和信息化部电子信息司 处长处长进一步扩大工作组规模进一步扩大工作组规模 申请报名的成员单位170+家成员单位管理成员单位管理 统一邮箱: 微信公众平台建立联络关系建立联络关系 贵州省贵阳市政府、中关村大数据产业联盟建立大数据专家团队建立大数据专家团队一、工作组概况一、工作组概况13一、工作组概况一、工作组概况(二)组织管理(二)组织管理n 2014年年12月月2日,工作日,工作组成立大会组成立大会n 2015年年7月月14日,工作日,工作组第二次全会,正式成组第二次全会,正式成立立7个专题组
7、个专题组n 2015年年12月月17日,工作日,工作组第三次全会(组第三次全会(2015年年年终总结)年终总结)n 工作组开展了一系列调工作组开展了一系列调研活动,组织线下活动研活动,组织线下活动5次,召开专题组会议次,召开专题组会议18次次工作组总体专题组组长:电子四院 张群国际专题组组长:华为 杨莉莉技术专题组组长:北大 王亚沙联合组长:中兴 董振江产品和平台专题组组长:浪潮电子 张东联合组长:亚信 陈利仓安全专题组组长:阿里云 陈雪秀联合组长:信安标委 叶润国工业大数据专题组组长:数码大方 齐建军电子商务大数据专题组组长:京东 葛胜利联合组长:阿里 姜蕾秘书处二、标准体系框架二、标准体系
8、框架1516n 基础标准基础标准为整个标准体系提供包括总则、术语和参考模型、元数据等基础性标准。n 技技术标准术标准该类标准主要针对大数据相关技术进行规范。包括数据治理和数据质量两类标准。其中,数据治理标准主要针对数据的收集、预处理、分析、可视化、访问、能力成熟度评价模型等方面进行规范。数据质量标准主要针对数据质量提出具体的管理要求和相应的指标要求,确保数据在产生、存储、交换和使用等各个环节中的质量,为大数据应用打下良好的基础,包括质量评价、数据溯源、质量检测等标准。二、标准体系框架二、标准体系框架17n 产品和平台标准产品和平台标准该类标准主要针对大数据相关技术产品和应用平台进行规范。包括关
9、系型数据库产品、非结构化数据管理产品、智能工具、可视化工具、数据处理平台和测试规范六类标准。其中关系型数据库产品标准针对存储和处理大数据的关系型数据库管理系统,从访问接口、技术要求、测试要求等方面进行规范,为关系型数据库管理系统进行大数据的高端事务处理和海量数据分析提供支持;非结构化数据管理产品标准针对存储和处理大数据的非结构化数据管理系统,从参考架构、数据表示、访问接口、技术要求、测试要求等方面进行规范;智能工具用来帮助用户对大数据进行分析决策,包括ETL、OLAP、数据挖掘等工具,智能工具标准对智能工具的技术及功能进行规范;可视化工具是对大数据处理应用过程中所需用到的可视化展现工具的技术和
10、功能要求进行规范;大数据平台标准是针对大数据存储、处理、分析系统从技术架构、建设方案、平台接口等方面进行规范;测试规范针对大数据的产品和平台给出测试方法和要求。二、标准体系框架二、标准体系框架18n 大数据安全标准大数据安全标准数据安全作为数据标准的支撑体系,贯穿于数据整个生命周期的各个阶段。抛开传统的网络安全和系统安全,大数据时代下的数据安全标准主要包括通用要求、隐私保护两类标准。n 应用和服务标准应用和服务标准应用和服务类标准主要是针对大数据所能提供的应用和服务从技术、功能、开发、维护和管理等方面进行规范。主要包括开放数据集、数据服务平台和领域应用数据三类标准。其中开放数据集标准主要对向第
11、三方提供的开放数据包中的内容、格式等进行规范;数据服务平台标准是针对大数据服务平台所提出的功能性、维护性和管理性的标准;领域应用数据指的是各领域根据其领域特性产生的专用数据标准,包括工业、电子商务等领域。二、标准体系框架二、标准体系框架二、大数据参考模型二、大数据参考模型19二、大数据标准化白皮书二、大数据标准化白皮书V2.0V2.0局势局势(产业、(产业、技术等)技术等)基本概念和内涵 特征 重要作用生态链生态链 大数据产业链(商业)大数据产业链(技术)规划规划 技术发展规划 国内外政策、趋势大数据大数据标准化标准化 参考架构 标准体系成功案成功案例例 十一大领域的应用案例20二、研究报告二
12、、研究报告4 4、加强研究加强研究(英国)开放数据白皮书 NIST在大数据领域的相关研究报告:大数据互操作性框架:第一卷:定义、大数据互操作性框架:第二卷:大数据分类、大数据互操作性框架:第四卷:安全与隐私、大数据互操作性框架:第六卷:参考架构、NIST大数据互操作性框架:第七卷:大数据标准路线图。为了更好的开展政府大数据开放共享和数据资产管理方面的标准化工作,工作组正在开展政府大数据分类分级和数据资产管理的相关研究工作,目前已经形成两份研究报告的初稿。21(二)标准化工作进展(二)标准化工作进展 已立项标准已立项标准三、标准研制三、标准研制序号计划号标准名称状态120141191-T-469
13、 信息技术 大数据 术语审定会220141190-T-469 信息技术 大数据 技术参考模型完成草案320141184-T-469 数据能力成熟度评价模型完成草案420141172-T-469 多媒体数据语义描述要求完成草案520141194-T-469 信息技术 科学数据引用完成草案620141200-T-469 信息技术 数据交易服务平台 交易数据描述完成草案720141201-T-469 信息技术 数据交易服务平台 通用功能要求完成草案820141202-T-469 信息技术 数据溯源描述模型完成草案920141203-T-469 信息技术 数据质量评价指标草案大纲1020141204-
14、T-469 信息技术 通用数据导入接口规范草案大纲23共定义了共定义了28个术语,该标准目前处于征求意见阶段。个术语,该标准目前处于征求意见阶段。重点介绍:重点介绍:大数据 大数据参考体系结构 大数据生命周期模型 大数据工程化 读时模式 数据科学家三、标准研制三、标准研制Volume24大数据大数据big databig data 具有数量巨大、来源多样、生成极快且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并分别赋予了它们在大数据语境下的定义
15、:数量 VolumeVolume多样性Variety 多变性variabilityVolume构成大数据的数据构成大数据的数据集的规模。集的规模。速度Velocity数据可能来自多个数据可能来自多个数据仓库、数据领数据仓库、数据领域或多种数据类型域或多种数据类型。Volume单位时间的数据流单位时间的数据流量。量。大数据其他特征,大数据其他特征,即数量、速度和多即数量、速度和多样性等特征都处于样性等特征都处于多变状态。多变状态。三、三、信息技术信息技术 大数据大数据 术语术语25三、三、信息技术信息技术 大数据大数据 术语术语大数据参考体系结构大数据参考体系结构 big data refere
16、nce architecture big data reference architecture 一种用作工具的、便于对大数据内在要求、设计结构和运行进行开放性探讨的高层概念模型。注:比较普遍认同的大数据参考体系结构一般包含系统协调者、数据提供者、大数据应用提供者、大数据框架提供者和数据消费者等5个逻辑功能构件。26大数据生命周期模型大数据生命周期模型 lifecycle model for big data lifecycle model for big data 用于描述大数据的“数据 信息 知识 价值”生命周期和指导大数据相关活动的模型;这些活动主要由收集、准备、分析和行动等阶段覆盖。注
17、:几个阶段的主要活动如下:a.收集阶段采集原始数据并按原始数据形式存储;b.准备阶段将原始数据转化为干净的、有组织的信息;c.分析阶段利用有组织的信息产生合成的知识;d.行动阶段运用合成的知识为企业生成价值。三、三、信息技术信息技术 大数据大数据 术语术语27大数据工程化大数据工程化 big data engineering big data engineering 为适应大数据对于有效存储、操作和分析的需求而运用治理独立资源的先进技术构建可伸缩数据系统的过程。读时模式读时模式 schema-on-read schema-on-read 一种数据模式应用;按此应用,在从数据库读取数据时,先经过
18、诸如转换、净化、整合之类准备步骤。数据科学家数据科学家 data scientist data scientist 数据科学专业人员;他们具有足够的业务需求管理机制方面的知识、领域知识、分析技能、以及用于管理数据生命周期中每个阶段的端到端数据过程的软件和系统工程知识。三、三、信息技术信息技术 大数据大数据 术语术语28该技术参考模型展示了一个通用的、由逻辑功能构件组成的大数据系统,该技术参考模型展示了一个通用的、由逻辑功能构件组成的大数据系统,该模型独立于供应商、实现技术和基础设施。该模型独立于供应商、实现技术和基础设施。三、三、信息技术信息技术 大数据大数据 技术参考模型技术参考模型29n
19、大数据价值链的两个维度组织:大数据作为一种数据科学方法对从数据到知识的处理过程中所实现的信息流价值 大数据价值通过数据的收集、预处理、分析、可视化和访问等活动实现。信息价值链(水平轴)大数据作为一种新兴的数据应用范式对IT技术产生的新需求所带来的价值 大数据价值通过为大数据应用提供存放和运行大数据的网络、基础设施、平台、应用工具以及其他IT服务实现IT价值链(垂直轴)三、三、信息技术信息技术 大数据大数据 技术参考模型技术参考模型30n 五个角色+两个重要的逻辑构件:数据消费者大数据框架提供者大数据应用提供者数据提供者系统协调者安全和隐私安全和隐私管理管理代表大数据系统中存在的不同技术角色能够
20、为大数据系统的其他五个主要构件提供服务和功能三、三、信息技术信息技术 大数据大数据 技术参考模型技术参考模型 已上报申请立项标准已上报申请立项标准序号已申请国家标准名称牵头单位1信息技术 大数据 基于参考架构下的接口框架华为2信息技术 大数据 分类指南中科院信工所3信息技术 大数据 系统通用规范电子四院4信息技术 大数据 系统运维和管理功能要求华为5信息技术 大数据 存储与处理系统功能要求华为6信息技术 大数据 存储与处理系统功能测试规范华为7信息技术 大数据 分析系统功能要求浪潮电子8信息技术 大数据 分析系统功能测试规范浪潮电子9信息技术 大数据 面向应用的基础计算平台基本性能要求浪潮电子
21、10信息技术 大数据 开放共享 第1部分:总则电子四院11信息技术 大数据 开放共享 第2部分:政府数据开放共享基本要求国家信息中心12信息技术 大数据 开放共享 第3部分:开放程度评价电子四院13信息技术 工业大数据 术语数码大方14信息技术 工业大数据 参考架构数码大方15信息技术 工业大数据 工业订单元数据数码大方16信息技术 工业大数据 产品核心元数据规范电子四院17信息技术 电子商务大数据 采集规范京东18信息技术 电子商务大数据 仓库建设模型京东19信息技术 电子商务大数据 应用指标体系 第2部分:电子商务大数据 京东开放程度形式许可证数据在网站上可用(任意格式)开放许可证作为结构
22、化数据可用(比如Excel,而不是表的扫描图)开放许可证以一种开放的、非专属的形式可用(比如,CSV、XML而不是Execl)开放许可证除了使用开放的格式,使用统一资源定位符(URLs)识别使用来自W3C的开放标准和推荐的事物开放许可证除了使用开放格式和URLs识别事物,链接数据到其他用户的数据,提供上下文环境开放许可证数据开放程度衡量标准数据开放程度衡量标准英国内阁办公室英国内阁办公室开放数据白皮书开放数据白皮书四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享3233四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享数据资源开放共享数据资源数据规划数据分类元数据数据交换
23、接口资源标识OID编码机制分发技术管理规程领域应用政务技术服务能力基层政务服务政务数据开放共享智慧城市公共服务信息平台参考模型教育教育资源教育管理教育公共支撑环境医疗社保农业 提出重点标准研制提出重点标准研制标准名称参编单位大数据开放共享 第1部分:总则中国电子技术标准化研究院、国家信息中心、北京信息资源中心、华为技术有限公司、上海卓繁信息技术股份有限公司大数据开放共享 第2部分:政府数据开放共享基本要求国家信息中心、中国电子技术标准化研究院、阿里云计算有限公司、上海卓繁信息技术股份有限公司、北京市信息资源管理中心大数据开放共享 第3部分:开放程度评价中国电子技术标准化研究院、国家信息中心、北
24、京信息资源中心、华为技术有限公司、上海卓繁信息技术股份有限公司信息技术 大数据开放共享 第4部分:政府资源目录体系拟立项四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享34 收集各领域元数据相关标准,建立元数据资源库金融交通林业卫生电子商务电子政务教育已收集到的各领域元数据相关标准已收集到的各领域元数据相关标准相关标准研制相关标准研制元数据资源库元数据资源库对外开放,提供服务对外开放,提供服务四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享35甲方:甲方:通过通过DCMMDCMM对对自身自身(行业、地方、(行业、地方、领域、企业)评估,识别领域、企业)评估,识别差距差距
25、,找到找到措施措施对对乙方乙方评估,找到合适评估,找到合适技术提供技术提供方方数据数据策略策略未来整体未来整体规划规划,指导部指导部署署数据数据战略战略定义数据定义数据需求需求,指导对数据资产,指导对数据资产的的分布控制与整合分布控制与整合建立数据标准建立数据标准体系体系,控制数据,控制数据质质量与安全量与安全提升人员提升人员数据管理能力数据管理能力,保障数,保障数据据生命周期生命周期乙方:乙方:准确准确定位定位甲方的甲方的能力和需求能力和需求,从从而而提出提出针对性的大数据针对性的大数据解决方案解决方案对对甲方甲方进行大数据能力进行大数据能力评估和认评估和认证证提供对机构和人员提供对机构和人
26、员DCMMDCMM的认可的认可通过通过DCMMDCMM认证,在项目招投标中认证,在项目招投标中证明自身具备数据证明自身具备数据规划、管理和规划、管理和咨询咨询的能力的能力提供提供DCMMDCMM的咨询和培训服务的咨询和培训服务实施的意义实施的意义数据能力成熟度评估数据能力成熟度评估行业行业地方地方企业企业领域领域用户用户第三方第三方四、工作重点:数据能力成熟度评估四、工作重点:数据能力成熟度评估36 结合已经申请的国家标准信息技术 大数据 系统通用规范,从可靠性、易用性、维护性、可移植性、安全可靠等功能方面对大数据系统做出规范,给出测试方法及用例等。目前草案已经完成,准备结合工作组更多的技术厂
27、商开展相关测试验证工作。四、工作重点:大数据系统测试四、工作重点:大数据系统测试3738四、重点领域:数据质量标准化四、重点领域:数据质量标准化n 需求报表及相关数据是否准确、可信?报表及相关数据是否准确、可信?信息系统的整体数据质量状况如何?信息系统的整体数据质量状况如何?跨系统数据之间是否存在矛盾或者不一致的地方?跨系统数据之间是否存在矛盾或者不一致的地方?业务数据的上报是否及时?数据的波动性、有效性如何业务数据的上报是否及时?数据的波动性、有效性如何?在复杂的企业信息环境下,数据在创建、存储、应用、维护、迁移、报废的整个生在复杂的企业信息环境下,数据在创建、存储、应用、维护、迁移、报废的
28、整个生命周期中的各个环节中,都会产生不同的数据质量问题命周期中的各个环节中,都会产生不同的数据质量问题信息数据信息数据生命周期生命周期数据存储数据存储数据应用数据应用数据维护数据维护数据迁移数据迁移数据报废数据报废数据创建数据创建人力人力资源资源复杂的信息环境复杂的信息环境统计统计分析分析财务财务管理管理合同合同管理管理客户客户管理管理39四、重点领域:数据质量标准化四、重点领域:数据质量标准化n 数据质量管理企业面临的问题哪些关键信息缺失哪些关键信息缺失?企业常见的数据质量问题企业常见的数据质量问题?哪些数据相互矛盾哪些数据相互矛盾?哪些数据是否可以清晰哪些数据是否可以清晰表达表达?哪些数据
29、没有按照时间哪些数据没有按照时间的要求进行上传的要求进行上传?哪些数据是重复进行哪些数据是重复进行定义的定义的?完整性完整性哪些数据没有按照要求哪些数据没有按照要求的规则存储?的规则存储?规范性规范性一致性一致性准确性准确性重复性重复性及时性及时性40四、四、重点领域:数据质量标准化重点领域:数据质量标准化n 概念数据质量问题及其研究由来已久,特别伴随着计 算机为主的信息技术发展而逐渐成为被广泛关注的研 究热点。虽然如此,但至今业界仍然没有就数据质量 的概念达成共识,而“满足应用需求的程度(fitness for use)”这一概念较被认可。41四、四、重点领域:数据质量标准化重点领域:数据质
30、量标准化n 技术架构数据质量指标数据质量指标数据质量评估数据质量评估度量度量分析分析数据质量管理数据质量管理提高提高数据质量管理评估数据质量管理评估42四、四、重点领域:数据质量标准化重点领域:数据质量标准化n 数据质量指标43四、重点领域:数据质量标准化四、重点领域:数据质量标准化n 数据质量管理数据质量是统计分析的基础数据质量是统计分析的基础数据质量是管理创新的需求数据质量是管理创新的需求数据质量是数据中心建设的需求数据质量是数据中心建设的需求数据质量是监管的需要数据质量是监管的需要数据是企业的重要资产,良好的数据质量可以提高数据的利用价值,帮助企业更准确的判断未来的发展趋势。数据质量管理
31、是数据中心标准规范建设的一部分,也是企业基础数据库建设的必要组成.数据资产管理是信息化发展的新的趋势,是企业中各个业务系统建设的需求,也是企业信息化管理创新的需要。通过数据质量管理可以保证上报数据的及时性、准确性,满足上下级之间数据监管的需要数据质量数据质量管理管理企业信息化的快速发展,累积了大量的数据,如何最大化这些数据的企业信息化的快速发展,累积了大量的数据,如何最大化这些数据的ROIROI,如何更好的利用这些数据进行决策分析是企业信息化面临的最大的问题。如何更好的利用这些数据进行决策分析是企业信息化面临的最大的问题。44四、四、重点领域:数据质量标准化重点领域:数据质量标准化n 数据质量
32、标准化情况 数据质量数据质量国际标准国际标准企业标准企业标准行业标准行业标准国家标准国家标准组织标准组织标准DAMA DMBOK数据质量度量,数据数据质量度量,数据质量模型,数据质量质量模型,数据质量指标,能力成熟度模指标,能力成熟度模型,物联网数据质量型,物联网数据质量1.ISO 19100 地理信息地理信息 质量质量2.JTC1/SC7 25012/25041IBM、Oracle2014年有两个元年有两个元数据质量的标准数据质量的标准数据数据 是企业信息化建设的核心,是企业信息化建设的核心,质量是企业信息化建设的灵魂质量是企业信息化建设的灵魂45四、重点领域:数据质量标准化四、重点领域:数
33、据质量标准化n 数据质量标准化需求数据质量评价指标数据质量评价模型数据质量管理体系数据质量管理评估体系46四、工作重点:工业大数据四、工作重点:工业大数据智能智能制造制造生产生产过程过程智能智能化化产品产品智能智能化化新业新业态新态新模式模式智能智能化化管理管理智能智能化化服务服务智能智能化化产品加工数据、零部件配置关系、变产品加工数据、零部件配置关系、变更记录数据、测试数据、生产设备、更记录数据、测试数据、生产设备、质量控制等数据质量控制等数据产品设计、建模数据、产品设计、建模数据、产品结构数据等产品结构数据等个性化定制数据、市场个性化定制数据、市场营销等数据营销等数据业务管理、组织结构、业
34、务管理、组织结构、电子商务、市场数据电子商务、市场数据产品故障检测数据、产品故障检测数据、标识数据标识数据47四、工业大数据标准重点四、工业大数据标准重点 工业大数据术语和参考架构工业大数据术语和参考架构 目前制造领域对工业大数据的理解和认识水平参差不齐,没有达成共目前制造领域对工业大数据的理解和认识水平参差不齐,没有达成共识的术语和参考结构。识的术语和参考结构。元数据和标识元数据和标识 如不加以规范和解决,产品采购、研发、生产、管理、销售、应用、如不加以规范和解决,产品采购、研发、生产、管理、销售、应用、运维等各环节中数据将不能贯通。运维等各环节中数据将不能贯通。工业大数据质量工业大数据质量
35、 与工业与工业企业的业务水平、业务绩效存在十分密切联系。企业的业务水平、业务绩效存在十分密切联系。需要需要为智能制为智能制造行业中的数据质量评定提供一套可供参考的、切实有效的技术依据。造行业中的数据质量评定提供一套可供参考的、切实有效的技术依据。工业大数据资产管理工业大数据资产管理 工业大数据工业大数据资产是企业间竞争的核心因素。资产是企业间竞争的核心因素。需要需要为数据资产管理业务为数据资产管理业务所涉及的各个主体和活动提供规范,从而能有效提高不同产业和企业对所涉及的各个主体和活动提供规范,从而能有效提高不同产业和企业对数据资产概念的理解以及对数据资产管理的认识数据资产概念的理解以及对数据资
36、产管理的认识。四、工业大数据中元数据和四、工业大数据中元数据和OIDOID标识体系标识体系标识分布式解析对象OID标识服务器1产品生产元数据智能制造中的对象(人、组织、产品等)数据关联OID注册解析系统服务器2产品流通元数据服务器3产品使用元数据服务器3产品回收元数据 现状:不同对象标识方案不统一 产品各环节信息无法互通共享 解决的问题:不同厂商、种类对象的统一标识 产品生产/流通/使用环节信息互通四、四、OIDOID标识体系是什么?标识体系是什么?OID(Object Identifier,对象标识符)无歧义地标识对象的全局唯一值 ISO/IEC 9834-1|Rec.ITU-T X.660
37、 编码方案:XX.XX.XX.XX.树状结构,注册机构向下分配OID,无穷结点 对象由从树根到结点的路径(OID)进行标识 例子:农业部:OID(1.2.156.326)扩展性强 分层管理四、四、OIDOID标识体系的价值标识体系的价值 l 支撑物联网产业大规模应用 标识体系之间不兼容、甚至相互矛盾的问题 全球范围内对象标识相互理解和处理的需求l 帮助用户买到高质量的产品 全球范围内查询、追溯产品信息 选择高质量、有保障的产品l 促进信息互通、交换和共享 异构标识管理系统互连,数据互通和交换 政府、地区、行业协会、企业现有的标识管理系统 打通产品、人、组织、机器等各类相关信息 产品:原材料采购
38、、生产、流通、销售、追溯、回收、管理等各环节的信息互通四、四、OIDOID标识体系的价值标识体系的价值l提高企业数据管理能力,加快转型升级对企业管理对象进行标识产品、资产、部门、人员、文件、上下游客户、原材料实时监控运行状况:信息生产、仓储、销售信息提高企业运行效率,提高管理决策水平l 提高政府行业管理能力 充分利用各部门数据、社会化数据 提高行业实时动态监管、数据分析、政策决策能力 打击造假、保证市场公平环境l 有效管理和利用我国信息资源l 保障信息安全、维护国家主权 四、四、OIDOID顶级编码方案顶级编码方案典型行业应用国家标准行业标准地方标准RFID传感器网络二维码商业运营公司组织内部
39、对象管理四、四、OIDOID解析示意图解析示意图通用解析应用解析四、我国四、我国OIDOID应用情况应用情况OID注册中心主要职责-负责管理“ISO分支”和“ISO-ITU联合分支”下的中国OID分支-负责国内OID注册、管理、维护以及在国际备案工作 应用领域典型注册机构食品追溯农业部、河北广联公司、天辰、万信方达信息安全国家密码管理局、工业和信息化部信息安全协调司、中金金融认证中心有限公司、天威诚信电子商务有限公司、上海市、山东省、四川省、广东省等多家电子认证公司医疗卫生卫生部统计信息中心、北京大学医学院、北医三院、用友医疗卫生信息系统有限公司、北京亿仁赛博医疗设备公司等金融中国银联网络管理
40、中国互联网络信息中心、清华大学、无线IP标准工作组、北大方正电子有限公司、广东华大集成技术有限责任公司等。监察管理公安部第三研究所协会贸促会商业分会、煤炭协会物资分会教育中央电化教育馆家电中国家电研究院智能制造智能制造安全生产安监总局四、四、OIDOID注册情况(注册情况(1 1)物联网载体典型注册机构 RFID、智能IC卡国家IC卡注册中心 RFID工作组传感器网络无锡物联网产业研究院、国家传感器网络标准工作组、感知集团有限公司、无锡“感知中国”物联网商会二维码中国二维码产业联盟、武汉矽感科技有限公司、上海新大陆翼码信息科技有限公司仪器仪表重庆享控智能科技有限公司四、四、OIDOID注册情况
41、(注册情况(2 2)四、四、OIDOID注册解析系统建设注册解析系统建设OID注册解析管理系统 l 注册解析服务注册服务系统对接托管服务快速建立下级系统l 多种互连方式国际OID树国内物联网公共平台l 系统对接万信方达:激光码天辰:RFID矽感:二维码享控:仪器仪表四、四、OIDOID标准情况(标准情况(1 1)OID基础类国家标准(14项)OID注册机构操作规程信息技术 开放系统互连 注册机构操作规程 一般规程已经发布OSI登记机构的操作规程 第3部分:ISO和ITU-T联合管理的顶级弧下的客体标识符弧的登记已经发布OSI 登记机构的操作规程 第5部分 VT控制客体定义的登记表已经发布OSI
42、 登记机构的操作规程 第6部分:应用进程和应用实体已经发布OSI登记机构操作规程 第8部分:通用唯一标识符的生成和登记及其用作ASN.1客体标识符组件已经发布抽象语法记法ASN.1信息技术 抽象语法记法一(ASN.1):基本记法规范已经发布信息技术 抽象语法记法一(ASN.1)第2部分信息客体规范已经发布信息技术 抽象语法记法一(ASN.1)第3部分:约束规范已经发布信息技术 抽象语法记法一(ASN.1)第4部分:ASN.1规范的参数化已经发布抽象语法记法ASN.1编码规则信息技术 ASN.1 编码规则 第1部分:基本编码规则(BER)、正则编码规则(CER)和非典型编码规则(DER)规范已经
43、发布信息技术 ASN.1 编码规则 第2部分:紧缩编码规则(PER)规范已经发布OID国家编号体系信息技术 开放系统互连 OID的国家编号体系和注册规程已经发布解析系统信息技术 开放系统互连 对象标识符解析系统规范在研信息技术 开放系统互连 解析系统运营机构的操作规程在研四、标准情况(四、标准情况(2 2)OID应用性国家标准(15项)物联网总体规划物联网标识体系 总则征求意见物联网标识体系 OID应用指南立项,国际标准传感器网络传感器网络 标识 传感节点编码规范报批传感器网络 标识 解析和管理规范报批交通交通运输 物联网解析系统征求意见交通运输 物联网标识规则交通运输 物联网对象分类机动车射
44、频识别 标签数据编码和存储分配要求(重庆地标)发布林业林业物联网 标识与解析技术规范研制林业物联网 对象分类林业物联网 标识分配方案二维码企业产品追溯体系评价指标申请立项信息技术 供应链平台 产品二维码标识规则信息技术 供应链平台应用 信息数据要求信息技术 供应链平台 数据接口要求四、四、OIDOID在应用案例在应用案例企业注册信息对象基本信息对象追溯信息64五、五、ISO/IEC JTC1 WG9大数据工作组大数据工作组 工作内容:工作内容:-制定大数据的基础标准-找出大数据标准化的差距-联络跟踪JTC1内部和外部组织正在开展的标准化工作-在基础标准的基础上研制其他大数据标准65五、五、IS
45、O/IEC JTC1 WG9大数据工作组大数据工作组 工作项:工作项:信息技术 大数据 概述和术语(ISO/IEC 20546)信息技术 大数据参考架构 第1部分:框架和应用指南(ISO/IEC TR 20547-1)信息技术 大数据参考架构 第2部分:用例和需求(ISO/IEC TR 20547-2)信息技术 大数据参考架构 第3部分:参考架构(ISO/IEC TR 20547-3)信息技术 大数据参考架构 第4部分:安全和隐私(ISO/IEC 20547-4)信息技术 大数据参考架构 第5部分:标准路线图(ISO/IEC TR 20547-5)近期活动:近期活动:2015年4月7-9日在德
46、国举办第一次工作组会议2015年7月7-9日在西班牙举办第二次工作组会议66五、五、ISO/IEC JTC1 WG9大数据工作组大数据工作组 JTC1/WG9JTC1/WG9工作组会议信息:工作组会议信息:年份年份日期日期会议地点会议地点201512月1-4日巴西 巴西利亚20163月8-10日电话会议20167月12-14日中国 北京201612月之前(待定)摩洛哥 马拉喀什67五、五、ISO/IEC JTC1 SC32数据管理与交换数据管理与交换 工作范围:工作范围:研制开发和维护有利于规范和管理的元数据、元模型和本体的标准,此类标准有助于理解和共享数据、信息和过程,支持互操作性,电子商务
47、以及基于模型和基于服务的开发,包括:建议用于规定和管理元数据、元模型和本体的框架;规定和管理元数据、元模型和本体;规定和管理过程、服务和行为数据;开发管理元数据、元模型和本体的机制,包括注册和存储;开发交换元数据、元模型和本体的机制,包括基于互联网、局域网等的语义。大数据相关工作:大数据相关工作:在2012年成立下一代分析技术与大数据研究组,并于2014年6月,启动四项为大数据提供标准化支持的新工作项目:SQL对多维数组的支持、SQL对JSON的支持、数据集注册元模型和数据源注册元模型。68五、五、ITU-T SG13第第13研究组研究组 具体包括:具体包括:Q2、Q17、Q18,由,由Q17
48、牵头开展牵头开展ITU-T大数据标准化大数据标准化的制定工作并负责向的制定工作并负责向TSAG汇报汇报 Q2涉及的研究课题:涉及的研究课题:Y.IoT-BigData-reqts“针对大数据的物联网具体需求和能力要求”Q17涉及的研究课题:涉及的研究课题:Y.BigData-reqts“基于云计算的大数据需求和能力”Q18涉及的研究课题:涉及的研究课题:Y.BDaaS-arch“大数据即业务的功能架构”69五、五、NIST NBD-PWG大数据公共工作组大数据公共工作组20132013年年6 6月正式成立月正式成立工作范围:工作范围:建立来自于产业界、学术界和政府的公共环境,共同形成达成共识的
49、定义、术语、安全参考体系结构和技术路线图,提出数据分析技术应满足的互操作、可移植性、可用性和扩展性需求和安全有效地支持大数据应用的技术基础设施,用于为大数据相关方选择最佳的方案。NISTNIST计划作三个计划作三个releaserelease,以对应,以对应NBD-PWGNBD-PWG工作的三个阶段:工作的三个阶段:a)识别high-level架构关键componentb)定义参考架构components间的总体接口c)通过用这些总体接口构建大数据总体应用来确认参考架构70五、五、NIST NBD-PWG NIST NBD-PWG大数据公共工作组大数据公共工作组5个子组及其个子组及其7个输出:
50、个输出:NIST Big Data Definitions&Taxonomies Subgroup 1.M0392:Draft SP 1500-1-Volume 1:Definitions 2.M0393:Draft SP 1500-2-Volume 2:Taxonomies NIST Big Data Use Case&Requirements Subgroup 3.M0394:Draft SP 1500-3-Volume 3:Use Case&RequirementsNIST Big Data Security&Privacy Subgroup 4.M0395:Draft SP 1500-