1、SN:MSDS-S-20071117 SN:MSDS-S-20071117 演示序号:演示序号:0404介绍提纲介绍提纲 什么是元数据什么是元数据 医药卫生元数据标准介绍医药卫生元数据标准介绍什么是元数据什么是元数据元数据(元数据(MetadataMetadata):是关于数据的数据(是关于数据的数据(Data about data).Data about data).简单来说,元数据对于数据来说,类似于一个人的名片,或者简单来说,元数据对于数据来说,类似于一个人的名片,或者是一本图书馆藏书的卡片。是一本图书馆藏书的卡片。这个概念相对抽象,下面通过一个例子来说明,什么是元数据这个概念相对抽象,
2、下面通过一个例子来说明,什么是元数据(以及元数据标准、元数据库、元数据记录等等)(以及元数据标准、元数据库、元数据记录等等)?什么是元数据什么是元数据例如,在一个大型的医疗卫生机构,拥有一个专门的数据资料例如,在一个大型的医疗卫生机构,拥有一个专门的数据资料管理机构,来统一管理各类需要提交和归档的数据资料。管理机构,来统一管理各类需要提交和归档的数据资料。这些要统一入库归档的数据各不相同:这些要统一入库归档的数据各不相同:l 从数据内容来看,可能有管理类、业务类和科学研究类;从数据内容来看,可能有管理类、业务类和科学研究类;l 从学科来看,可能有基础医学、临床医学、预防医学等等;从学科来看,可
3、能有基础医学、临床医学、预防医学等等;l 从存储类型来看,可能有从存储类型来看,可能有DBaseDBase、EXCELEXCEL、文本文件等等;、文本文件等等;总之,内容、结构、数据量、介质各不相同。总之,内容、结构、数据量、介质各不相同。什么是元数据什么是元数据当我拿着自己的数据光盘去入库归档的当我拿着自己的数据光盘去入库归档的时候,管理员要求我填写一张关于要入时候,管理员要求我填写一张关于要入库数据的表格,以便于管理和查阅。库数据的表格,以便于管理和查阅。填好这张关于要入库光盘的表格,就是填好这张关于要入库光盘的表格,就是这张光盘中数据的元数据!这张光盘中数据的元数据!而这一张表格所规定的
4、要填写的内容而这一张表格所规定的要填写的内容(以及填写规定),就可以看作是这个(以及填写规定),就可以看作是这个单位内部的单位内部的“元数据标准元数据标准”!什么是元数据什么是元数据这张表格每填写好一张,就可以录入成这张表格每填写好一张,就可以录入成为元数据库中的一条元数据记录:为元数据库中的一条元数据记录:我们把这张表格中所规定填写的项目,我们把这张表格中所规定填写的项目,作为一个一个的属性字段,可以建立一作为一个一个的属性字段,可以建立一个关于元数据的数据库个关于元数据的数据库就是元数就是元数据库:据库:什么是元数据什么是元数据这时候,这张这时候,这张“表格表格”上规定的内容,以上规定的内
5、容,以及关于填写的一些规定,就可以看作是及关于填写的一些规定,就可以看作是医药卫生科学数据共享网元数据标准医药卫生科学数据共享网元数据标准对医药卫生科学数据共享网来说,针对每对医药卫生科学数据共享网来说,针对每一个共享数据集,都要以元数据著录的形一个共享数据集,都要以元数据著录的形式来式来“填写填写”一张这样的一张这样的“表格表格”。介绍提纲介绍提纲 什么是元数据什么是元数据 医药卫生元数据标准介绍医药卫生元数据标准介绍 制订背景与方法制订背景与方法 参考性引用文件及一些概念参考性引用文件及一些概念 元数据标准内容元数据标准内容医药卫生元数据标准介绍医药卫生元数据标准介绍医药卫生元数据标准介绍
6、医药卫生元数据标准介绍 制订背景与方法制订背景与方法科技部国家科学数据共享工程的科技部国家科学数据共享工程的元数据标准化原则与方法元数据标准化原则与方法中规定了科学数据共享工程中领域元数据标准的制订方法:中规定了科学数据共享工程中领域元数据标准的制订方法:共享元数据标准共享元数据标准领域元数据标准领域元数据标准领域专用元数据标准领域专用元数据标准共享参考元数据共享参考元数据医药卫生元数据标准介绍医药卫生元数据标准介绍 制订背景与方法制订背景与方法共享元数据标准共享元数据标准共享公共元数据共享公共元数据共享核心共享核心元数据元数据科技部国家科学数据共享工程的科技部国家科学数据共享工程的元数据标准
7、化原则与方法元数据标准化原则与方法中规定了共享元数据标准中三个元数据集合的包含关系。中规定了共享元数据标准中三个元数据集合的包含关系。共享元数据标准共享元数据标准领域元数据标准领域元数据标准领域专用元数据标准领域专用元数据标准共享参考元数据共享参考元数据扩展参考扩展参考医药卫生元数据标准介绍医药卫生元数据标准介绍 制订背景与方法制订背景与方法领域元数据标准领域元数据标准科技部国家科学数据共享工程的科技部国家科学数据共享工程的元数据标准化原则与方法元数据标准化原则与方法中规定领域元数据制订时的选取原则。中规定领域元数据制订时的选取原则。共享元数据标准共享元数据标准领域元数据标准领域元数据标准领域
8、专用元数据标准领域专用元数据标准共享公共元数据共享公共元数据工作基础工作基础必须包含必须包含共享核心元数据共享核心元数据领域领域元数据标准元数据标准医药卫生元数据标准介绍医药卫生元数据标准介绍 制订背景与方法制订背景与方法领域专用元数据标准领域专用元数据标准科技部国家科学数据共享工程的科技部国家科学数据共享工程的元数据标准化原则与方法元数据标准化原则与方法中规定了领域专用元数据制订时的选取原则。中规定了领域专用元数据制订时的选取原则。必须包含必须包含共享参考元数据共享参考元数据共享公共元数据共享公共元数据共享核心元数据共享核心元数据共享元数据标准共享元数据标准领域元数据标准领域元数据标准领域专
9、用元数据标准领域专用元数据标准工作基础工作基础领域元数据标准领域元数据标准扩展参考扩展参考领域专用领域专用元数据标准元数据标准医药卫生元数据标准介绍医药卫生元数据标准介绍 参考性引用文件及一些概念参考性引用文件及一些概念SDS/T XXX2004 SDS/T XXX2004 科学数据共享元数据内容标准科学数据共享元数据内容标准DICOM DICOM 数字化影像和通讯标准数字化影像和通讯标准ICD-10 ICD-10 国际疾病分类代码第国际疾病分类代码第1010版版CPT CPT 通用操作术语代码通用操作术语代码SNOMED SNOMED 医学系统化术语学系统医学系统化术语学系统LOINC LO
10、INC 实验室观察结果标识符名称和代码系统实验室观察结果标识符名称和代码系统DRGsDRGs 诊断相关分组诊断相关分组UMLS UMLS 统一的医学语言系统统一的医学语言系统IMT IMT 国际医学术语国际医学术语元数据元素元数据元素 metadata elementmetadata element元数据的基本单元。元数据的基本单元。注:与注:与UMLUML术语中的属性同义。术语中的属性同义。元数据实体元数据实体 metadata entitymetadata entity一组说明数据相同特性的元数据元素。一组说明数据相同特性的元数据元素。注:与注:与UMLUML术语中的类同义。术语中的类同义
11、。元数据子集元数据子集 metadata sectionmetadata section元数据的子集合,由相关的元数据实体元数据的子集合,由相关的元数据实体和元素组成。和元素组成。注:与注:与UMLUML术语中的包同义。术语中的包同义。医药卫生元数据标准介绍医药卫生元数据标准介绍医生医生医生 参考性引用文件及一些概念参考性引用文件及一些概念1.1.范围范围2.2.规范性引用文件规范性引用文件3.3.一致性要求一致性要求4.4.术语和定义术语和定义5.5.符号与约定符号与约定6.6.元数据模型元数据模型 7.7.元数据摘要描述元数据摘要描述附录:元数据附录:元数据UMLUML图图 元数据元数据字
12、典描述字典描述医药卫生元数据标准介绍医药卫生元数据标准介绍 元数据标准内容元数据标准内容与科学数据共享元数据标准的对照与科学数据共享元数据标准的对照科学数据共享元数科学数据共享元数据标准是一个用来据标准是一个用来制订元数据标准的制订元数据标准的标准,是一个标准标准,是一个标准的标准。的标准。它的内容如右侧的它的内容如右侧的目录所示:目录所示:共享核心元数据共享核心元数据共享公共元数据共享公共元数据共享参考元数据共享参考元数据共享核心元数据的内容会在共享公共元数据的相应位置再次出现共享核心元数据的内容会在共享公共元数据的相应位置再次出现共享公共元数据的内容也会在共享参考元数据的相应位置再次出现共
13、享公共元数据的内容也会在共享参考元数据的相应位置再次出现与科学数据共享元数据标准的对照与科学数据共享元数据标准的对照领域元数据标准(例领域元数据标准(例如医药卫生科学数据如医药卫生科学数据共享元数据标准)就共享元数据标准)就是根据是根据科学数据共科学数据共享元数据标准享元数据标准这个这个“标准的标准标准的标准”所制所制定出来的产物,所以,定出来的产物,所以,它的内容结构相对简它的内容结构相对简单,如图示:单,如图示:前言前言引言、范围引言、范围引用文档、概念术语引用文档、概念术语元数据(内容)元数据(内容)-根实体根实体-子集(多个,依次介绍)子集(多个,依次介绍)元数据类型实体元数据类型实体
14、-引用信息引用信息 (科学数据共享元数据还(科学数据共享元数据还 包含覆盖范围信息)包含覆盖范围信息)医药卫生元数据标准介绍医药卫生元数据标准介绍 元数据标准内容元数据标准内容-基本架构基本架构实体集信息实体集信息元数据子集元数据子集 类型实体类型实体(引用信息)(引用信息)定义了定义了元数据元数据基本架基本架构、构、9 9个子集个子集和和154154个子元个子元素素。医药卫生元数据标准介绍医药卫生元数据标准介绍 元数据标准内容元数据标准内容-基本架构基本架构我们也可以把这个抽象的模型我们也可以把这个抽象的模型理解为:理解为:医药卫生科学数据共享所要求医药卫生科学数据共享所要求填写的那张填写的
15、那张“元数据登记表元数据登记表”,除了几个基本信息(元数据根除了几个基本信息(元数据根元素)外,其填写内容大致分元素)外,其填写内容大致分为为9 9个方面。个方面。n 标识信息标识信息n 内容信息内容信息n 分发信息分发信息n 数据质量信息数据质量信息n 数据表现信息数据表现信息 元数据标准内容元数据标准内容子集概述子集概述医药卫生元数据标准介绍医药卫生元数据标准介绍n 扩展信息扩展信息n 数据模式信息数据模式信息n 限制信息限制信息n 维护信息维护信息 元数据标准内容元数据标准内容子集概述子集概述医药卫生元数据标准介绍医药卫生元数据标准介绍1)1)标识信息标识信息 提供了标识数据集的信息。包
16、括数据集引用、摘要、目提供了标识数据集的信息。包括数据集引用、摘要、目的的 、可信度、状态、负责方、维护信息、浏览图、关键词说、可信度、状态、负责方、维护信息、浏览图、关键词说明、限制信息、语种、字符集、分类和环境说明明、限制信息、语种、字符集、分类和环境说明1414个子元素。个子元素。2)2)内容信息内容信息 提供了数据内容特征的描述信息。包括数据的资源域、领提供了数据内容特征的描述信息。包括数据的资源域、领域特征、获取手段、描述对象和服务内容域特征、获取手段、描述对象和服务内容5 5个子元素。个子元素。元数据标准内容元数据标准内容子集概述子集概述医药卫生元数据标准介绍医药卫生元数据标准介绍
17、3)3)分发信息分发信息 提供了有关资源分发的信息。包括分发格式、提供了有关资源分发的信息。包括分发格式、分发者、传送方式分发者、传送方式3 3个基本内容。个基本内容。4)4)数据质量信息数据质量信息 提供了数据集质量总体评价信息。包括数据志提供了数据集质量总体评价信息。包括数据志和数据志说明和数据志说明2 2个基本内容。个基本内容。5)5)数据表现信息数据表现信息 提供了数据集的数据表示信息。包括医学数字图象、提供了数据集的数据表示信息。包括医学数字图象、疾病疾病GISGIS分布分布2 2个子元素。个子元素。6)6)扩展信息扩展信息 提供了领域定义的元数据信息。包括扩展在线资源提供了领域定义
18、的元数据信息。包括扩展在线资源信息和扩展元素信息信息和扩展元素信息2 2个子元素。个子元素。7)7)数据模式信息数据模式信息 提供了有关数据集概念模式的信息。包括名称、模式提供了有关数据集概念模式的信息。包括名称、模式语言、约束语言、语言、约束语言、ASCIIASCII码文件和图形文件码文件和图形文件5 5个子元素。个子元素。元数据标准内容元数据标准内容子集概述子集概述医药卫生元数据标准介绍医药卫生元数据标准介绍8)8)限制信息限制信息 提供了元数据或数据集的限制信息。包括法律限提供了元数据或数据集的限制信息。包括法律限制、访问限制、使用限制、安全限制、安全限制分级制、访问限制、使用限制、安全
19、限制、安全限制分级5 5个子元素。个子元素。9)9)维护信息维护信息 元数据或数据集内容更新信息维护信息。包括有元数据或数据集内容更新信息维护信息。包括有关资源的更新频率、更新范围、维护注释、维护方联关资源的更新频率、更新范围、维护注释、维护方联系信息系信息4 4个子元素。个子元素。元数据标准内容元数据标准内容子集概述子集概述医药卫生元数据标准介绍医药卫生元数据标准介绍医药卫生元数据标准介绍医药卫生元数据标准介绍类型实体:引用信息类型实体:引用信息l 是前面的根实体和子集中被多次用到的内容,例如联系信是前面的根实体和子集中被多次用到的内容,例如联系信息(固定包含详细地址、电话等)、地址信息(固
20、定包含行息(固定包含详细地址、电话等)、地址信息(固定包含行政区划、城市、邮政编码等)等等,在填写时都会被集成化政区划、城市、邮政编码等)等等,在填写时都会被集成化的多次用到,所以被打包定义为一个数据类型。的多次用到,所以被打包定义为一个数据类型。l 它是一种对填写的参考、帮助或者说附录性补充内容,不它是一种对填写的参考、帮助或者说附录性补充内容,不是元数据内容的组成部分。是元数据内容的组成部分。元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍 本标准采用三种方式定义和描述元数据元素本标准采用三种方式定义和描述元数据元素l 摘要描述摘要描述l UML U
21、ML图描述图描述l 数据字典描述数据字典描述 本标准采用定义、英文名称、数据类型、值本标准采用定义、英文名称、数据类型、值域、短名、注解、子元素和扩展巴氏范式对元数域、短名、注解、子元素和扩展巴氏范式对元数据元素进行摘要描述据元素进行摘要描述.元数据元素摘要描述元数据元素摘要描述 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍元数据元素摘元数据元素摘要描述示例要描述示例 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍q 本标准采用统一建模语言(本标准采用统一建模语言(UMLUML)来进行模型构建。来进行模型构建
22、。q 应用应用UML UML 中包、类和属性的概念。医药卫生科学数据共中包、类和属性的概念。医药卫生科学数据共享元数据分为三个层次享元数据分为三个层次,与与UMLUML对应关系如下对应关系如下:UML UML包包元数据子集元数据子集 UMLUML类类元数据实体元数据实体 UMLUML类属性类属性元数据元素元数据元素元数据元素元数据元素UMLUML图描述方法图描述方法 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍数据模式信息(from 数据模式信息)元数据扩展信息(from 元数据扩展信息)数据质量信息(from 数据质量信息)数据表现信息(from
23、数据表现信息)分发信息(from 分发信息)内容信息(from 内容信息)限制(from 限制信息)维护信息(from 维护信息)元数据标识(from 标识信息)0.n+数据集限制信息0.n0.n+数据集维护信息0.n元数据元数据标识符0.1:字符串元数据语种0.1:字符串元数据字符集0.1:字符集代码元数据联系方1.n:负责方元数据创建日期:日期引用元数据标准名称0.1:字符串元数据标准版本0.1:字符串0.n+应用模式信息0.n0.n+元数据扩展信息0.n0.n+数据质量信息0.n0.n+数据表现信息0.n0.n+分发信息0.n0.n+内容信息0.n0.n+元数据限制信息0.n0.1+元数
24、据维护0.1+标识信息 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍元元数数据据子子集集信信息息1)元数据标识信息元数据标识信息n 元数据子集元数据子集2)元数据内容信息元数据内容信息3)元数据分发信息元数据分发信息4)元数据质量信息元数据质量信息5)元数据表现信息元数据表现信息疾病三间分布表示医学影像表示元数据(from 元数据实体集信息)数据表现信息0.n+数据表现信息0.n6)元数据扩展信息元数据扩展信息7)元数据模式信息元数据模式信息8)元数据限制信息元数据限制信息9)元数据维护信息元数据维护信息 元数据标准内容元数据标准内容描述方式描述方式
25、医药卫生元数据标准介绍医药卫生元数据标准介绍n 引用信息引用信息 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍元数据元素字典描述主要由以下内容对元数据进行描述元数据元素字典描述主要由以下内容对元数据进行描述q 名称名称/角色名称角色名称q 缩写名和域代码缩写名和域代码q 定义定义q 约束约束/条件条件q 最大出现次数最大出现次数q 数据类型数据类型q 域:就实体而言,域说明实体包含的行数;对一个元数域:就实体而言,域说明实体包含的行数;对一个元数据元素而言,域说明允许的值或使用自由文本。据元素而言,域说明允许的值或使用自由文本。元数据元素字典描述元数据元素字典描述 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍 字典表示示例字典表示示例 元数据标准内容元数据标准内容描述方式描述方式医药卫生元数据标准介绍医药卫生元数据标准介绍介绍完毕,谢谢!介绍完毕,谢谢!医药卫生元数据标准医药卫生元数据标准