电子政务导论-第4章-电子政务信息资源建设课件.ppt

上传人(卖家):三亚风情 文档编号:3175972 上传时间:2022-07-28 格式:PPT 页数:84 大小:3.78MB
下载 相关 举报
电子政务导论-第4章-电子政务信息资源建设课件.ppt_第1页
第1页 / 共84页
电子政务导论-第4章-电子政务信息资源建设课件.ppt_第2页
第2页 / 共84页
电子政务导论-第4章-电子政务信息资源建设课件.ppt_第3页
第3页 / 共84页
电子政务导论-第4章-电子政务信息资源建设课件.ppt_第4页
第4页 / 共84页
电子政务导论-第4章-电子政务信息资源建设课件.ppt_第5页
第5页 / 共84页
点击查看更多>>
资源描述

1、第4章 电子政务信息资源开发利用4.1 政务信息资源概述政务信息资源概述 4.1.1 政务信息资源的概念政务信息资源的概念 4.1.2 政务信息资源与政府行政效果政务信息资源与政府行政效果 4.1.3 政务信息资源的共享与再利用政务信息资源的共享与再利用4.1.1 政务信息资源的概念政务信息资源的概念1.信息资源及其开发信息资源(Information Resources是指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等)的集合。在这三大资源中,信息资源是唯一不具有消耗性的资源,也是唯一具有能动性的资源,它的开发与利用,不仅对于能源资源和材料资源

2、有优化利用结构、节约和增值的作用,而且作为生产要素、无形资产和社会财富,是构筑社会文明、推动社会进步的动力。在信息时代,提高信息资源开发利用水平是增强综合国力和国际竞争力的必然选择,是全球化形势下国际竞争的重点。政府是信息资源的最大拥有者,也是这些信息资源的最大生产者、消费者、发布者。加强信息资源开发利用有利于贯彻落实科学发展观,促进经济社会协调发展;有利于政府更好地履行经济调节、市场监管、社会管理和公共服务职能;有利于满足人民群众日益增长的精神文化需求,体现以人为本,提高全民素质,促进社会全面进步;有利于发展信息内容产业,扩大就业,优化经济结构,提高市场效率;有利于节能降耗,保护环境,推动传

3、统产业改造,促进经济转型。2.政务信息资源及其内涵政务信息是由政府机关通过合法途径采集整合的,与公共管理、公共服务及依法行政相关,并借助特定载体显露的信息。政务信息资源的公共性,使得它的涵盖面极广,涉及了政府与社会的政治、军事、经济、人物、文化、科技、天文、地理、产业等的历史和新闻、过去和现在、本地和周边。从政府产生和需求两个角度看,政务信息资源有如下几种:(1)政府辖地天文地理信息,自然资源要素贮备、变化、分布及其与周边地区的关系。(2)政府辖地社会信息:政治、军事、战争、经济、建设、文化、教育、科技、人物、事件等。(3)政府决策信息:国家和地方政策、法规、条例、决策咨询、战略发展研究报告、

4、阶段性总体规划、财政收支等。(4)政府为社会服务信息:国内外重大政治新闻、经济运行分析、热点透视、社情民意动向、税收征管、统计报表、市场供需信息、社会经济预测信息、金融财经信息、科技教育与人才信息等。(5)政府自身有关信息:政府各组成部门的工作职能,各种文件、会议情况,总结报告,记录数据,办公文档,机关行政管理信息,经验介绍,驻外办事机构,政府间交流等。(6)辖地规划和发展信息:思想库,发展和政府行政的历史沿革、设施等信息,如城市地下网、管、道和线的分布和结构等。4.1.2 政务信息资源与政府行政效果政务信息资源与政府行政效果 1.信息处理能力决定政府决策水平能不能从信息资源中找到决策需要的信

5、息;能不能排除干扰信息。2.数据存在形式决定政务运行效率和效果数据资源的表现形式多种多样,表现形式不同,人们接收的效果不同;存在形式不同,处理的效率不同。这些都会影响政务运行的效率和效果。3.信息响应速度决定政务服务的满意度按照“舰队理论”,最慢的舰艇的速度决定了整个舰队运动的速度。从经济学的角度看,政府服务与管理业务流程信息畅通,才能有效降低双方的“交易成本”,提高服务的满意度。4.1.3 政务信息资源的共享与再利用政务信息资源的共享与再利用 1.“信息孤岛”全能政府理念会造成权欲和利欲的膨胀。于是,各政府机构为了部门以及个人利益,会过分强调分工的“合理性”和保密的“重要性”,导致各个部门都

6、建有信息资源应用系统,彼此间相互隔绝,信息资源的支配权与政府机构权力划分紧密结合,形成大量分散异构的“信息孤岛 合理的权力划分,意味着信息资源的合理分配。解决信息孤岛问题的核心思路便是整合。2.政务信息资源的公共属性 政务信息资源是一种按照可共享性取自社会成员(包括个人、企业和其它社会组织)、又用于社会的社会公共资产,属于公共产品和服务的一部分,政府信息行为目的是维护和增进公共利益。进一步说,任何政府部门的信息都具有公共属性,而不能成为部门的私产,不能被私化。3.信息资源共享交换与公开 政务信息资源共享(governebt information resource sharing)就是在政府部

7、门之间建立政务信息交流和流转机制,使政府部门之间,政府与公民、法人和其他组织之间实现政务信息的广泛交流和享用。鉴于政务信息资源的公共属性,政务信息资源的共享是具有法律保障的。政务信息资源共享包括两个方面:政府内部部门之间的共享和政府与公众或企业、组织之间的共享。前者通过信息交换(informetion exchange)技术实现,后者通过信息公开(informationopenness)形式实现。4.政务信息资源再利用 政务信息资源再利用是指政府以外的主体为其它目的而使用该信息。政府以外主体可以是个人、企业或其它社会组织机构;再利用目的可以是商业性的,公益性的(科研、教育、其它公益服务);可以

8、是直接传播,也可以是增值加工后,形成更有使用价值或更容易使用(如数字化,数据库化)的信息产品。促进政务信息资源再利用的意义在于充分发挥政务信息资源具有的潜在价值。5.政务信息增值过程(1)在政务信息数据采集过程中的增值。在信息数据采集中去伪存真,提升了所采集数据的价值。(2)在政务信息数据的存储和传输过程中增值。对采集到的数据进行整序处理、传输,按照一定的信息格式保存。有序性有助于信息检索和查询,实现信息共享。(3)在政务信息数据的分析和使用过程中增值。利用统计分析等方法对保存的有序信息进行分析,建立决策模型,进一步提升了信息数据的价值。(4)在政务信息的知识发现过程中增值。利用数据挖掘等技术

9、手段,挖掘保存的不同层次的信息,可以发现隐含的一些政府管理规律,有助于实现知识化的政府管理。6.政务信息资源共享与再利用的政策依据政务信息资源共享与再利用的政策依据(1)促进大数据发展行动纲要(国发201550号)。(2)推进“互联网+政务服务”开展信息惠民试点实施方案(国办发201623号)。(3)政务信息资源共享管理暂行办法(国发201651号)。(4)政务信息系统整合共享实施方案(国办发201739号)。(5)政务信息资源目录编制指南(试行)(发改高技20171272号)。4.2 政务信息采集政务信息采集 4.2.1 政务信息源及其分类政务信息源及其分类 4.2.2 政务信息采集渠道政务

10、信息采集渠道4.2.1 政务信息源政务信息源 1.信息源 信息源,就是信息的来源,它可看作是生产、持有和传递信息的一切物体、人员和机构。政务信息源,就是政务活动中信息的来源,或政务信息资源的来源。按照观察的角度,可以对政务信息源进行不同的划分,形成不同的政务信息源。2.政务信息源分类(1)从政务信息源产生或形成的方向,政务信息源可以分为:上级信息源 下级信息源 外部信息源(2)从信息掌握者的性质,政务信息源可以分为:个人信息源 组织机构(或部门)信息源,如来自管理监督部、政策研究部门、政策执行部门、行政业务部门的信息。(3)按照信息载体的性质,政务信息源可以分为:实物信息源。纸质信息源。人信息

11、源。电子化(文件、数据库)信息源。(4)按照信息产生的过程,政务信息源可以分为:直接政务活动形成信息源。技术活动形成信息源。(5)按照信息加工层次和集约程度,政务信息源可以分为:一次信息源。也称本体信息源,是人们在科研活动、生产经营活动和其他一切活动中所产生的各种原始记录。从一次信息源中提取信息是信息资源生产者的任务。二次信息源。也称感知信息源,主要储存于人的大脑中,传播、咨询、决策等领域所依赖的主要是二次信息源。三次信息源。又称再生信息源,主要包括口头信息源、体语信息源、文献信息源、电子信息源和实物信息源,其中又以文献信息源(包括印刷型和电子型文献信息源)为常用。四次信息源。也称集约信息源,

12、是文献信息源和实物信息源的集约化(如档案馆、图书馆、数据库等)和系统化(如博物馆、样品室、展览馆、标本室等)。4.2.2 政务信息采集渠道政务信息采集渠道(1)会议。(2)公文。(3)新闻。(4)电子公告板,(5)Web数据。(6)联机检索。(7)建立内部管理专家库,实现对专家隐性知识的管理。(8)建立信息的交流机制。(9)其他渠道。例如个别访问、座谈调查、现场观察、问卷(电话、纸质、网络)调查、实地考察与研究等。4.3 政务信息资源的组织与存储政务信息资源的组织与存储 4.3.1 对象、属性与对象类对象、属性与对象类 4.3.2 政务数据政务数据 4.3.3 政务数据元政务数据元 4.3.4

13、 文件与数据库文件与数据库 4.3.5 电子政务信息资源的存储电子政务信息资源的存储4.3.1 政务数据政务数据1.数据与信息数据(data)是关于事实、概念或指令的一种形式化表示。数据既可以表示对象,也可以表示数据类。在信息处理界:数据是记录下来,可以被鉴别的符号。信息是对于数据的解释。2.政务数据分类政务数据就是在政务活动中产生的信息的记载。(1)按信息的应用属性分类按信息的应用属性,电子政务分为空间数据、基础数据、政务数据、专题数据和多媒体语音数据。(2)按照在政务活动中的变化性分类按照在政务活动中的变化性,政务数据可以分为静态数据和动态数据。(3)按照在政务活动中涉及的范围分类按照在政

14、务活动中涉及的范围,政务数据可以分为微观数据和宏观数据。4.3.2 政务数据元政务数据元 1.数据元及其属性 数据元(data element)被看作不可再分的最小数据单元。数据元通过定义、标识、表示以及允许值等一系列属性描述。一般说来,数据元由3部分组成:对象类。对数据元归类的界定。特性。在同一对象类中,区分和描述对象的属性或属性集合。表示。数据的被表达方式,与数据元的值域关系密切。数据元的值域是该数据元的所有允许值的集合。2.数据元的基本属性主要有以下几类:(1)标识类,适用于数据元标识的属性。包括名称、标示符、版本、注册机构、同义名称、相关环境。(2)定义类。描述数据元语义方面的属性,包

15、括定义。(3)关系类。描述数据元之间相互关联和(或)数据元与分类模式、数据元概念、对象、实体之间关联的属性包括分类模式、关键字、相关数据参照、关系类型。(4)表示类。描述数据元表示方面的属性包括表示类别、表示形式、数据元值的数据类型、数据元值的最大长度、数据元值的最小长度、表示格式、数据元允许值。(5)管理类。描述数据元管理与控制方面的属性包括主管机构、注册状态、提交机构、备注。3.数据元标准化数据元的标准化就是对数据元的总则、定义、描述、分类、表示和注册等制定统一的标准,并加以贯彻、实施的过程。4.电子政务公共数据元类 目数据元目录人员类(01)姓名,姓名汉语拼音,身份证件名称,身份证件号码

16、,公民身份证号码,照片,性别,性别代码,民族,民族代码,出生日期,婚姻状况,婚姻状况代码,健康状况,健康状况代码,国籍。国籍代码,从业状况,从业状况代码,职业,职业代码,工作单位,年收入,月收入,专业技术职务,专业技术职务代码,职务,职务代码,政治面貌,政治面貌代码,所学专业,专业代码,学位名称,学位代码,学历名称,学历代码,语种名称,语种代码,语种熟练程度,语种熟练程度代码,住址机构类(02)机构名称,组织机构代码,工商注册号,国税税务登记号,地税税务登记号,机构类型,机构类型代码,经济类型,经济类型代码,行业名称,行业代码,隶属关系,负责人,法定代表人,注册资本,信用等级,信用评定机构,经

17、营范围,经营期限自,经营期限至,经营场所,网址,成立日期,注销日期位置类(03)国家和地区名称,国家和地区代码(三字母),国家和地区代码(辆字母),国家和地区代码(数字),行政区划名称,行政区划代码,乡镇(街道)名称,街路巷,门(楼)号,通信地址,邮政编码,详细地址,电子邮箱,联系电话,传真,移动电话日期/时间类(04)日期,时间,日期时间,年,季度公文类(05)秘密等级,保密期限,紧急程度,发文机关标识,发文机关,发文机关代字,发文年号,发文序号,成文日期,签发人,公文标题,公文正文,主题词,主送机关,抄送机关,份数序号,印发机关,印发日期其他类(06)货币名称,货币字母代码,货币数字代码,

18、金额,银行名称,账户名称,账号,支票号,计量单位,利率,汇率会计科目名称,卡名,卡号4.3.3 文件与数据库文件与数据库1.文件文件就是用一个名字命名的、存储在外部存储器(磁带、磁盘等)上的信息集合。也就是说,用文件进行数据管理有两个主要特征:(1)每个文件都有一个可以识别的名字文件名,并且可以用这个名字对文件中的信息进行访问。(2)文件中的信息被保存在外部存储器中。外部存储器中的信息是无源信息所保存的信息不因断电而丢失(而内存的信息会因断电而丢失)。文件系统程序1程序2程序n数据集1数据集n数据集2 2.数据库的特征 与文件技术相比,数据库技术有如下一些特点:(1)从以程序为中心转向以数据为

19、中心,数据可以为不同的应用共享。程序1程序2程序n数据库1DBMS(2)数据模型化。为了有效地组织数据库中的数据集,要为它们建立合适的数据模型,目前绝大多数DBMS采用关系模型。关系模型就是用二维表组织数据并描述数据之间的联系。表a 学生信息学 号姓 名性别系别班级2005201010101孙小云 男经济贸易电商052012005301010202张文娟 女信息技术网络05301表b 成绩信息学号课程编号成绩2005201010101E20102852005201010101E20105902005301010202I30105772005301010202I30106882005301010

20、202I3010799表c 课程信息课程编号课程名学时E20102电子商务原理30E20105物流技术40I30105计算机网络原理60I30106信息系统安全64I30107计算机网络管理40(3)数据独立性增强。数据库中的数据可以从用户、数据库管理员和系统程序员三个不同级别的模式,分别称为外模式、模式和内模式。三级模式之间通过两级映射,使外模式独立于模式,模式独立于内模式。3.SQL语言 SQL(structured query language)是一种应用于关系数据库的形式化语言。它能够完成关系数据库的数据定义、数据查询、数据操纵和数据控制。SQL功能所使用动词含 义数据定义CREATE

21、DROPALTER从一个表或多个表中检索列和行创建一个新表删除一个表数据查询SELECT在一个已经建立的表中修改字段设计数据操纵INSERTUPDATEDELETE向一个表增加行更新表中已经存在行的某几列值从一个表中删除行数据控制GRANTREVOKE用户授权权限收回4.3.4 网络存储与共享技术网络存储与共享技术 服务器附加存储 (Server Attached Storage,SAS)网络附加存储 (Network Attached Storage,NAS)存储局域网 (Storage Area Network,SAN)DAS的存储结构服务器存储设备LAN存储设备服务器用户用户文件服务器存

22、储设备LAN服务器用户用户NAS的存储结构 StorageClientServerLANSANSAN的结构 4.4 政务信息资源整序政务信息资源整序 信息资源整序也称信息有序化或信息组织,是指利用一定的科学方法和规则,使信息资源有序化的活动。通过信息整序,可以保证用户对信息的高效获取和利用,实现信息的有效流通和组合。4.4.1 政务信息编码政务信息编码1.信息编码及其基本原则(1)信息分类编码体现科学化、标准化、规范化、合理化。(2)参照国家标准中有关分类标准体系。(3)参照原有的编码体系,尽量考虑政务业务使用习惯。(4)保证编码的下列性质:唯一性每个编码对象仅有一个代码,一个代码只唯一地表示

23、一个编码对象。匹配性代码结构与分类体系相匹配。可扩展性留有足够的备用码空间。简短性代码尽量简短,含义要强,要与可扩展性综合考虑。稳定性生命力要强。识别性计算机可以识别。可操作性容易操作。自检性具有自检错误的能力。2.信息编码的代码类型代 码有含义代码无含义代码顺序码无序码 约定顺序码 系列顺序码 递增顺序码 并 置 码 组 合 码 层 次 码 缩 写 码(1)无意义代码在无意代码中,无序码是机器程序随机产生的、没有任何规律的代码。所以日常见的多的是顺序码。顺序码是采用数字或字母来表示编码对象,并按照数字或字母顺序建立编码对象间的顺序关系。代 码名称100199全国人大、全国政协、高检、高法机构

24、200299中央直属机关及直属事业单位300399国务院各部委900999全国性人民团体、民主党派机关(2)缩写码。缩写码是从编码对象的名称中抽取一个或多个字符而生成的代码。其特点是容易记忆,但可能产生重复。代 码国家(或地区)名称ATAUSTRIA奥地利CACANADA加拿大CNCHINA中国FRFRANCE法国USUNITED STATES美国(3)层次码。层次码以编码对象集合中的层次分类为基础,产生的连续且递增的组(类)形式的代码。第三层代码第二层代码第一层代码 (4)并置码。并置码是由一些代码段组成的复合代码,每个代码段提供了编码对象的一个特征,并且这些特征是相互独立的。这样,以代码的

25、值很容易对编码对象进行分组。1位数字校验码 3位数字顺序码:奇数为男性,偶数为女性8位数字出生日期码5位数字出生地地址码4.4.2 政务信息资源分类与分类标引政务信息资源分类与分类标引 1.信息资源分类及其基本方法(1)线分类法(method of linear classification):按照选定的若干属性(或特征)将分类对象逐次地分为若干层级,每个层级又分为若干类目的分类方法。在同一分支中,同层级类目之间构成并列关系,不同层级类目之间构成隶属关系。(2)面分类法(method of area classification):按照选定的若干属性(或特征)将分类对象按每一属(或特征)划分成

26、一组独立的类目,每一组类目构成一个“面”(或“轴”),再按一定顺序将各个“面”平行排列。使用时,可根据需要将这些“面”中的类目组合在一起,形成一个复合类目。(3)混合分类法(method of composite classification:):将线分类法与面分类法组合使用,以其中一种为主,另一种做补充的分类方法。2.政务信息资源分类标准 政务信息资源目录体系(government information resource catalog system,GB/T )对政务信息资源从基础面、行业面、服务面和物理面4个角度分类,形成主题分类、行业分类、服务分类和资源形态分类4种顶层分类方法。(1

27、)主题分类 主题分类是从基础面,即从政务信息资源本身特定的含义,对政务信息资源进行分类。主题分类法采用线性方法,用4位符号代码对一、二、三级类目进行编码。类别代码名 称描述和说明一级二级三级01综合政务关于政治领域的当前状况和发展规划A 方针政策政府制定的、宏观的、指导各个领域发展的方针政策A 专题政策B 政策理论研究C 组织机构B 中共党务A 组织工作02经济管理关于经济的管理、规划、发展概况A 发展规划关于经济的宏观的发展规划(2)行业分类行业分类是从基础面,即从政务信息资源生产具有的部门和行业特定背景,对政务信息资源进行分类。主题分类法采用等级层次结构排列,用4位符号代码对大类、中类、小

28、类三级类目进行编码。类别代码名 称描述和说明大类中类小类A农、林、牧、渔业01 农业1 谷物及其他作物的种植包括谷物、薯类、油料、豆类、棉花、2 蔬菜、园艺作物的种植包括蔬菜、花卉以及其他园艺作物的种植3 水果、坚果、饮料和香料作物的种植4 中药材的种植02 林业1 林木的培育和种植包括育种、造林、林木的抚育和管理2 木材和竹才的采运包括木材的采运、竹材的采运(3)服务分类信息资源可以为使用者提供特定的服务。服务分类就是根据提供的服务不同,来区别政务信息资源的种类,采用线形分类方法,用5位符号代码对主题、业务、职能3个层次的类目进行编码。类别代码名 称描述和说明主题业务职能1为公众服务为公众服

29、务领域,描述了01 公民基本生活保障民众基本生活保障,包括01 退休和残疾包括对退休和残疾人员的02 事业救济包括蔬菜、花卉以及其他园艺作物的种植03 住房援助 02 社团服务社团服务,包括:针对研究、扩大和改善社区发展,01 安居乐业安居乐业,包括:提供关于住宅援助的公共信息、(4)资源形态分类 信息资源都是依附于某种物理介质存在的。按照介质的物理形态对政务信息资源分类就是资源形态分类。资源形态分类采用混合分类方法,用5位符号代码对3个级别的类目进行编码。3.分类标引 分类标引是利用某种分类法及其使用规则,按照信息资源内容及某些外表特征,赋予信息资源分类号,以便将信息资源款目或文献实体排列成

30、与分类法的分类体系一致的系统的过程。4.4.3 主题标引与主题词表主题标引与主题词表 1.主题标引与主题词 主题标引是指通过对文本资源的内容进行主题分析,用表示文本资源的内容主题特征的相应词语作为检索标识的过程。这些表达可以标识文本资源主题特征的词语,被称为主题词或叙词,它们是一些以概念为基础的,规范化的,具有组配性能,并可显示词间语义关系的词和词组。主题词分正式主题词和非正式主题词。正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的引导词。2.主题词表 主题词表也称叙词表,是一个主题词的集合,这个集合形成按一定顺序排列的、由主题词组成的一种规范化的动态词典,也称为按照主题语义检索的

31、语言。3.主题标引方法 进行主题标引的关键是选取合适的主题词。主题词的选取,要尽可能地满足以下要求:(1)必须从被整序的信息单元所包含的内容中选取;(2)必须是能够代表信息单元主题的词语,尽可能使其概念单一、准确,概念的外延应尽可能地缩小,最好是能和信息单元的外延相一致。(3)尽可能地选择规范词,学术性文献应该选择正式出版的汉语主题词表中所列的规范词,公文用主题词应该选择国务院办公厅发布的国务院公文主题词表中所列的规范词。如果实在没有规范词,或者不熟悉主题词表,可以选用本学科内使用频率高、比较通用的词语。这些非规范的词被称作“关键词”。例4.11 论文:论信息管理中的整序原则 关键词:信息管理

32、 原则 整序 例4.12 公文:国务院关于清理“三角债”工作的通知 主题词:企业 债务 通知 4.自由词标引 自由词标引是用未经规范化处理的自然语言表述公文主题概念,并作为表达公文主题概念的检索标识。自由词标引范围包括:(1)某些主题概念虽然可以采用组配标引或上位词标引,但使用频率较高;(2)新出现的主题概念,包括新科技、新政策、新理论、新名词术语等;(3)人物、时间和年代称号;(4)地区、组织机构名称。4.4.4 电子文本置标与电子文本置标与XML 1.电子文本置标概述2.文本置标的好处有如下几点:(1)文本经过置标,其结构就可以被计算机理解,在文本的各部分之间形成语义连接。(2)将文本的结

33、构语义与其表现形式和处理方式分离,做到文本信息与设置无关,与处理系统的环境无关,甚至与所用的语种无关。这样,就能方便地实现信息交换。(3)通过置标,在文本中加入“文件类型定义”信息,可以使文件的置标形式化,并用类型定义说明哪些元素和属性在文件中以何种顺序出现等,以便确定对某一文件的置标是否正确。张三,江苏无锡青山二村59号,85801998姓名地址电话号码 2.XML(1.)可扩展标记语言元标记语言(2)XML描述的是结构和语义,而不是格式(3)自描述性:文档数据库化(4)作为数据表示的开放标准:数据重用、共享与交换(5)基于XML的数据存储与访问4.4.5 元数据元数据 1.元数据及其分类

34、元数据(metadata)是一种定义及描述其他数据的数据,是对数据项的说明性数据。(1)描述型元数据(intellection metadata):是描述、发现和鉴别信息对象的工具,主要描述信息资源的主题合内容特征,如机读目录(machine readable catalogue,MARC)、都柏林核心(dublin core,DC)等。(2)结构型元数据(structural metadata):用来描述信息资源的内部结构,如书目的目录、章节、段落等特征。(3)存储控制型元数据(access control metadata):用来描述信息资源的利用条件合期限,以及这些资源的知识产权特征合使

35、用期限等。(4)评价型元数据(critical metadata):用来描述合管理数据在信息评价体系中的位置。2.信息资源元数据及其作用(1)信息资源的发现与定位。现代信息资源具有两大特征:数量多、门类广、分布分散;信息资源提供者与信息资源使用者的信息不对称:给的不知道要的要什么,要的不知道给的有什么。因此,发现和定位信息资源是信息资源的开发利用和共享关键和前提。元数据以简洁的形式提炼了数据资源的特性。通过元数据,使用者可以对信息资源的内容以及格式、质量、管理等进行深入了解。(2)信息资源管理和整合。通过元数据提供的简洁的信息资源特征,可以把握信息资源的内容、数量、质量、分布,以便进行有效的管

36、理和整合。3.政务核心元数据及其分类(1)公共信息资源核心元数据 公共信息资源核心元数据包括了表5.9中给出的元数据元素和6个元数据实体:资源负责方、资源格式信息、关键字说明、时间范围、资源分类、元数据联系方。(2)交换服务信息资源核心元数据 4.政务元数据格式 目前使用的政务信息的元数据格式主要有两种:GILS(Government lnformation Locater Service,政府信息指引服务)和DC(Dublin Core,都柏林核心元数据集)。其中依照GILS发展信息指引服务的国家有美国、加拿大、日本等;而英国、澳大利亚、新西兰等国在电子政务建设中,则是以DC为基础制定了用于

37、电子政务系统的元数据集。4.4.6 电子政务信息资源目录体系电子政务信息资源目录体系 1.电子政务信息资源目录体系及其结构政务信息资源目录体系(directory system for electronic government information resources)是以元数据为核心,以政务分类表和主题词表为控制词表,采用统一的标准,对电子政务信息资源类别进行描述,为政务部门、社会公众提供资源发现、定位及相关服务的系统。支撑环境(软件、硬件和网络)政务信息资源目录使用者政务信息资源目录 一站式服务系统公共资源目录交换服务目录标 准 与 管 理安 全 保 障公共资源核心元数据交换服务核心元

38、数据2.电子政务信息资源目录体系的功能(1)编目(cataloging)。编目是政务信息资源提供者对公共资源核心元数据和交换服务资源核心元数据进行编辑的过程。这个过程包括:分别提取政务数据和交换服务资源的相关特征信息,形成对应的公共资源核心元数据和交换服务核心元数据。对政务信息资源核心元数据中的分类信息进行赋值。提供在编目时对政务信息资源进行唯一标识赋码。(2)注册(register)。政务信息资源目录管理者接收和处理政务部门提供的政务信息资源目录内容的过程,功能包括:提交通过政务信息资源元数据汇交平台,实现管理者和提供者之间的政务信息资源元数据提交。审核管理者确认提供者提交的政务信息资源元数

39、据是否符合标准要求的过程。入库对于通过审核的元数据进行入库管理。(3)发布(publish)。政务信息资源目录管理者对外公布政务信息资源目录的过程。发布通过一站式系统进行。(4)查询。为应用系统提供标准的调用接口,支持公共资源核心元数据和交换服务元数据的查询。(5)维护。功能如下:公共资源核心元数据库和交换服务元数据库的建立、更新、备份与恢复。服务监控。日志分析。用户反馈。辅助系统管理。3.电子政务信息资源目录体系的工作流程 各级政务部门对公共资源核心元数据和交换服务资源元数据编目,并通过元数据注册系统向管理者注册。管理者发布已注册的目录内容。政务信息资源使用者(简称使用者)通过政务信息资源目

40、录一站式服务系统向管理者发送目录查询请求。管理者将查询结果分别返回使用者。交换服务元数据注册系统目录服务器政务信息资源目录一站式服务系统提供者管理者使用者部门政务信息资源库公共资源库交换资源库核心元数据注册编目检索多个案例查询目录 发布维护查询目录目录信息提取特征提取特征目录信息4.电子政务信息资源目录体系建设政府信息资源目录体系主要有元数据、政务分类表、主题词表、信息组织、导航、发现、定位与服务等关键要素,目录体系的建设要围绕以上要素。经过多方努力和十几年的反复调查、研究、参考国外经验,国家发展改革委 中央网信办于2017年6月30日发政务信息资源目录编制指南,作为信息资源元数据、分类标准、

41、唯一标识编码标准、目录制作技术标准,为全国性的政府信息资源目录体系建设提供基础。政务信息资源目录体系共分6部分,分别是总体框架、技术要求、核心元数据、政务信息资源分类和政务信息资源标识符编码方案。4.5 政务数据分析与挖掘4.5.1 决策与数据需求决策与数据需求 1.决策、风险与信息 任何决策都是有风险的。决策的风险来自信息的不完全和不对称。维纳(N,Norbert Wiener,18941964)认为,信息是消除不确定性的东西,并给出了一句名言“所谓有效的生活,就是获得足够信息的生活。”2.决策层次:结构化数据与非结构化数据 3.决策需要的数据(1)面向主题性。(2)数据变化性的历史性。(3

42、)不可修改性。(4)数据集成性。4.5.2 数据仓库与数据挖掘 1.数据仓库 数据仓库(Data Warehouse)是一种为决策提供数据的机制。对 比 内 容数 据 库数 据 仓 库数据内容当前值历史的、存档的、归纳的、计算的数据数据目标面向业务操作程序、重复处理面向主题域、分析应用数据特性动态变化、按字段更新静态、不能直接更新,只能定时添加、刷新数据结构复杂、高度结构化,适合操作计算简单、适合分析使用频率高中到低数据访问量每个事务只访问少量记录有的事务可能要访问大量记录要求的响应时间以秒为单位计算以秒、分钟、甚至小时为计算单位 2.OLAP OLAP(on-line analytical

43、processing,在线分析处理或联机分析处理)是一个得到广泛应用的数据仓库使用技术,是用于支持复杂的决策分析、支持信息管理和业务管理人员决策活动的一种决策分析工具。它可以根据分析人员的要求,迅速、灵活地对大量数据进行复杂的查询处理,并以直观的、容易理解的形式将查询结果提供给各种决策人员,使他们能够迅速、准确地掌握企业的运营情况,了解市场的需求。OLAP技术主要有两个特点:一是在线性(On-Line),表现为对用户请求的快速响应和交互式操作;二是多维分析(Multi_Analysis),这也是OLAP技术的核心所在。1 2 3 4 时间(月)1 2 3 4 时间(月)生产总值 地域 服务业

44、农业 北京 生产总值 服务业 农业 切片 上海 切片 时间维 时间维 产品维 地域维 旋转 产品维 地域维(a)将某行维换向为列维 地域 北京 无锡 时间 产品 销售量 销售量 第1季度:第2季度:地域 北京 无锡 时间 第1季度 第2季度 产品 :旋转(b)改变页面显示 上钻下钻4.5.3 数据分析及挖掘 1.数据分析 数据分析(data analysis)是一种目标明确的数据处理,包括现状分析、原因分析、预测分析(定量),以及用户兴趣分析、网络行为分析、情感语义分析等,主要采用对比分析、分组分析、交叉分析、回归分析等常用分析方法,并将结果用关联图、系统图、矩阵图、KJ(亲和图)法、计划评审

45、技术、PDPC(Process Decision Program Chart,过程决策程序图)法、矩阵数据图描述出来,并通过与业务结合的解读,对决策提供参考。2.数据挖掘数据挖掘(data mining),又称为资料采矿、资料探勘、资料挖掘或数据库知识发现(knowledge-discovery in databases,KDD),是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘的粗略地过程为:数据准备(data preparation)、数据挖掘,以及结果的解释评估(interpretation and eval

46、uation)。数据挖掘依不同的视角,可以有不同的分类方法:按照数据挖掘的任务划分,有:分类或预测模型数据挖掘、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等。按照数据挖掘的对象(数据源)划分,有:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据、异质数据库、遗产(legacy)数据库,以及Web数据源。按照数据挖掘的方法划分,有:统计方法、机器学习方法、神经网络方法和数据库方法。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分

47、析(主元分析法、相关分析法等)、以及模糊集、粗糙集、支持向量机等。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例的推理CBR、遗传算法、贝叶斯信念网络等。神经网络方法,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是基于可视化的多维数据分析或OLAP方法,另外还有面向属性的归纳方法。4.5.4 大数据时代的数据中心 1.大数据时代到来IDC关于全球创建及复制的数据总量预测 2.大数据具备四个层面的特点:第一,数据体量巨大:从TB级别,跃升到PB级别,甚至EB级别;第二,数据类型繁多:数据多样,网络日志、视频、图片、地理位

48、置信息等等,几乎无所不包。第三,价值密度低:不相关信息数量庞大,需要深度挖掘分析。例如,在连续不断的视频监控过程中,可能有用的数据仅有一两秒。第四,处理速度快:“1秒定律”,即实时分析而非批量式分析,立竿见影而非事后见效,而这与传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”Volume、Variety、Value、Velocity。3.大数据存储 1)存储数据库技术、2)NoSQL数据库 4.大数据预处理(1)数据清洗 去噪声和无关数据。(2)数据集成 将多个数据源中的数据结合起来存放在一个一致的数据存储中。(3)数据变换 把原始数据转换成为适合数据挖掘的形式。(4)数据规约 主要

49、方法包括:数据立方体聚集,维度归约,数据压缩,数值归约,离散化和概念分层等。5.大数据算法思想大数据算法思想(1)由于大数据难于全部放入内存计算,为此考虑基于少量的数据处理空间亚线性算法和外存算法。(2)由于单机计算能力的限制,为此必须采用并行处理并行算法。(3)针对大数据处理时要访问全部数据时间会很长,为此开发出访问部分数据时间亚线性算法。(4)由于计算机能力不足或者知识不足,需要在某些地方人来帮忙,为此开发出众包算法。6.大数据计算模式大数据计算模式 按照应用环境,大数据处理可以有图4.22所示的3种不同模式:(1)批量计算(batch computing)模式。(2)流式计算(strea

50、m computing)模式。(3)分布式计算。3)分布式计算与云计算 云计算有如下优点。超大规模。高可靠性。通用性。价格低廉。云计算对资源整合起着作用。超强的存储能力。数据与应用共享性高。降低数据的管理成本。4.6 政务信息资源共享4.6.1 政务信息资源共享及其特征 1.政务信息资源共享及其意义政务信息资源共享及其意义 信息资源共享简称信息共享(Information Sharing),是指在信息标准化和规范化的基础上,按照法律法规,采用现代信息技术和传输技术,使信息和信息产品在不同层次、不同部门信息系统间实现交流与共享的活动。其目的是将信息这一种在互联网时代中越来越重要的资源与其他人共同

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(电子政务导论-第4章-电子政务信息资源建设课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|