1、数据库设计技巧数据库设计技巧数据库设计技巧?这里假定我们要建立一个用户信息的表格,其中要存储用户的名字、公司、公司地址和一些个人的收藏夹或。在开始时,你可能定义一个如下的表格结构:、零状态形式 张三北京海淀李四北京朝阳、扩展性问题?张三北京海淀张三北京海淀李四北京朝阳李四北京朝阳、数据重复问题?张三北京海淀李四北京朝阳、数据重复问题?北京海淀北京朝阳 张三李四、数据冗余问题?数据库设计技巧?一、商品信息表的设计 假设你是一家百货公司电脑部的开发人员,某天老板要求你为公司开发一套网上电子商务平台,该百货公司有数千种商品出售,不过目前仅打算先在网上销售数十种方便运输的商品,当然,以后可能会陆续在该
2、电子商务平台上增加新的商品出售。现在开始进行该平台数据库的商品信息表的设计。每种出售的商品都会有相同的属性,如商品编号,商品名称,商品所属类别,相关信息,供货厂商,内含件数,库存,进货价,销售价,优惠价。数据库设计技巧?你很快就设计出个表:商品类型表(),供货厂商表(),商品信息表():商品类型表()名称类型约束条件 说明 无重复 类别标识,主键 ()不允许为空 类型名称,不允许重复 不允许为空 该类别的父类别标识,如果是顶节点的 话设定为某个唯一值 ()限定层,初始值为 类别的先序遍历,主要为减少检索数据库的次数 供货厂商表()名称类型约束条件 说明 无重复 供货商标识,主键 ()不允许为空
3、 供货商名称 商品信息表()名称 类型约束条件 说明 无重复 商品标识,主键 ()不允许为空 商品名称 不允许为空 商品类型标识,和关联 ()允许为空 相关信息 不允许为空 供货厂商标识,和关联 初始值为 内含件数,默认为 初始值为 库存,默认为 不允许为空 进货价 不允许为空 销售价 不允许为空 优惠价 数据库设计技巧?你拿着这个表给老板检查,老板希望能够再添加一个商品图片的字段,不过只有一部分商品有图片。,你在商品信息表()中增加了一个的型字段,然后再建了一个新表商品图片表():商品图片表()名称 类型约束条件 说明 无重复 商品图片标识,主键 不允许为空 所属商品标识,和关联 ()不允许
4、为空 图片存放路径 数据库设计技巧?一段时间后,老板打算在这套平台上推出新的商品销售,其中,某类商品全部都需添加“长度”的属性。第一轮折腾来了当然,你按照添加商品图片表的老方法,在商品信息表()中增加了一个的型字段,又建了一个新表商品长度表():商品长度表()名称 类型约束条件 说明 无重复 商品图片标识,主键 不允许为空 所属商品标识,和关联 ()不允许为空 商品长度说明 商品“宽度”、“高度”的增加?数据库设计技巧?去掉商品信息表()中的字段,添加商品额外属性表()和商品额外信息表()个表来完成添加新属性的功能。商品额外属性表()名称 类型约束条件 说明 无重复 商品额外属性标识,主键 (
5、)不允许为空 额外属性名称 商品额外信息表()名称 类型约束条件 说明 无重复 商品额外信息标识,主键 不允许为空 所属商品标识,和 关联 不允许为空 商品额外属性标识,和关联 ()不允许为空 商品额外属性值 数据库设计技巧?数据库设计范式 关系数据库设计之时是要遵守一定的规则的。尤其是数据库设计范式 现简单介绍(第一范式),(第二范式),(第三范式),另有第四范式和第五范式留到以后再介绍。在你设计数据库之时,若能符合这几个范式,你就是数据库设计的高手。第一范式()第一范式()第一范式():数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日
6、期型等。职工号,姓名,电话号码组成一个表(一个人可能有一个办公室电话 和一个家里电话号码)规范成为有三种方法:重复存储职工号和姓名。这样,关键字只能是电话号码。职工号为关键字,电话号码分为单位电话和住宅电话两个属性 职工号为关键字,但强制每条记录只能有一个电话号码。第二范式()第二范式()数据库表中所有非关键字段都完全依赖于任意一组候选关键字。假定选课关系表为(学号,姓名,年龄,课程名称,成绩,学分),关键字为组合关键字(学号,课程名称),因为存在如下决定关系:(学号,课程名称)(姓名,年龄,成绩,学分)这个数据库表不满足第二范式,因为存在如下决定关系:(课程名称)(学分)(学号)(姓名,年龄
7、)第二范式()第二范式()()数据冗余:同一门课程由个学生选修,“学分”就重复次;同一个学生选修了门课程,姓名和年龄就重复了次。()更新异常:若调整了某门课程的学分,数据表中所有行的“学分”值都要更新,否则会出现同一门课程学分不同的情况。()插入异常:假设要开设一门新的课程,暂时还没有人选修。这样,由于还没有“学号”关键字,课程名称和学分也无法记录入数据库。()删除异常:假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。第二范式()第二范式()把选课关系表改为如下三个表:学生:(学号,姓名,年龄);课程
8、:(课程名称,学分);选课关系:(学号,课程名称,成绩)。这样的数据库表是符合第二范式的,消除了数据冗余、更新异常、插入异常和删除异常。第三范式()第三范式()在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。所谓传递函数依赖,指的是如果存在“”的决定关系,则传递函数依赖于。因此,满足第三范式的数据库表应该不存在如下依赖关系:关键字段 非关键字段 非关键字段第三范式()第三范式()假定学生关系表为(学号,姓名,年龄,所在学院,学院地点,学院电话),关键字为单一关键字“学号”,因为存在如下决定关系:(学号)(姓名,年龄,所在学院,学院地点,学院电话)
9、这个数据库是符合的,但是不符合,因为存在如下决定关系:(学号)(所在学院)(学院地点,学院电话)把学生关系表分为如下两个表:学生:(学号,姓名,年龄,所在学院);学院:(学院,地点,电话)。数据库系统设计思考 基本元素包括用户、内容、相互关系 设计思考(同学录):涉及到的人物:用户 设计到的内容:省份、城市、学校、班级 设计关系:留言处理设计要点 数据库设计 有几张表?各个表有哪几个字段?每个表之间的关系?页面设计 需要几个页面?各个页面之间的跳转关系?数据库设计 用户 用户表 内容 省份表 城市表 学校表 班级表、班级类型表 关系 留言表数据库设计 用户表字段名称字段说明字段名称字段说明编号
10、注册时间真实姓名商务电话登录名宅电登录密码移动电话所在班级通讯地址性别邮政编码生日邮件地址寻呼机号码工作单位号码号数据库设计 省份表字段名称字段说明编号(主键)城市名称对应省份字段名称字段说明编号(主键)省份名称 城市表数据库设计 学校表:字段名称字段说明字段名称字段说明编号地区学校名字学校类型省代号已注册班级数城市号邮编删除标志网址创建者数据库设计 班级表字段名称 字段说明字段名称字段说明编号正管理员班级名称副管理员所在省份编号班级类型所在城市编号班级数目学校编号入学时间删除标志班级类型表:字段名称字段说明编号(主键)类型名称数据库设计 留言表字段名称字段说明字段名称字段说明编号留言时间留言
11、标题删除标志留言内容编辑用户编号班级编号编辑时间留言用户编号是否置顶个数据库的设计技巧、原始单据与实体之间的关系 可以是一对一、一对多、多对多的关系。在一般情况下,它们是一对一的关系:即一张原始单据对应且只对应一个实体。在特殊情况下,它们可能是一对多或多对一的关系,即一张原始单证对应多个实体,或多张原始单证对应一个实体。这里的实体可以理解为基本表。明确这种对应关系后,对我们设计录入界面大有好处。例:一份员工履历资料,在人力资源信息系统中,就对应三个基本表:员工基本情况表、社会关系表、工作简历表。这就是“一张原始单证对应多个实体”的典型例子。个数据库的设计技巧、主键与外键 一般而言,一个实体不能
12、既无主键又无外键。在 图中,处于叶子部位的实体,可以定义主键,也可以不定义主键(因为它无子孙),但必须要有外键(因为它有父亲)。主键与外键的设计,在全局数据库的设计中,占有重要地位。当全局数据库的设计完成以后,有个美国数据库设计专家说:“键,到处都是键,除了键之外,什么也没有”,这就是他的数据库设计经验之谈,也反映了他对信息系统核心(数据模型)的高度抽象思想。因为:主键是实体的高度抽象,主键与外键的配对,表示实体之间的连接。个数据库的设计技巧、基本表的性质 基本表与中间表、临时表不同,因为它具有如下四个特性:()原子性。基本表中的字段是不可再分解的。()原始性。基本表中的记录是原始数据(基础数
13、据)的记录。()演绎性。由基本表与代码表中的数据,可以派生出所有的输出数据。()稳定性。基本表的结构是相对稳定的,表中的记录是要长期保存的。理解基本表的性质后,在设计数据库时,就能将基本表与中间表、临时表区分开来。个数据库的设计技巧、范式标准 基本表及其字段之间的关系,应尽量满足第三范式。但是,满足第三范式的数据库设计,往往不是最好的设计。为了提高数据库的运行效率,常常需要降低范式标准:适当增加冗余,达到以空间换时间的目的。例:有一张存放商品的基本表,如表所示。“金额”这个字段的存在,表明该表的设计不满足第三范式,因为“金额”可以由“单价”乘以“数量”得到,说明“金额”是冗余字段。但是,增加“
14、金额”这个冗余字段,可以提高查询统计的速度,这就是以空间换时间的作法。在 中,规定列有两种类型:数据列和计算列。“金额”这样的列被称为“计算列”,而“单价”和“数量”这样的列被称为“数据列”。表 商品表的表结构商品名称 商品型号 单价 数量 金额电视机 吋 个数据库的设计技巧、通俗地理解三个范式通俗地理解三个范式,对于数据库设计大有好处。在数据库设计中,为了更好地应用三个范式,就必须通俗地理解三个范式(通俗地理解是够用的理解,并不是最科学最准确的理解):第一范式:是对属性的原子性约束,要求属性具有原子性,不可再分解;第二范式:是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性;第三范式:
15、是对字段冗余性的约束,即任何字段不能由其他字段派生出来,它要求字段没有冗余.没有冗余的数据库设计可以做到。但是,没有冗余的数据库未必是最好的数据库,有时为了提高运行效率,就必须降低范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时遵守第三范式,降低范式标准的工作放到物理数据模型设计时考虑。降低范式就是增加字段,允许冗余。个数据库的设计技巧.要善于识别与正确处理多对多的关系 若两个实体之间存在多对多的关系,则应消除这种关系。消除的办法是,在两者之间增加第三个实体。这样,原来一个多对多的关系,现在变为两个一对多的关系。要将原来两个实体的属性合理地分配到三个实体中去。这里的第三个实体,实质
16、上是一个较复杂的关系,它对应一张基本表。一般来讲,数据库设计工具不能识别多对多的关系,但能处理多对多的关系。例:在“图书馆信息系统”中,“图书”是一个实体,“读者”也是一个实体。这两个实体之间的关系,是一个典型的多对多关系:一本图书在不同时间可以被多个读者借阅,一个读者又可以借多本图书。为此,要在二者之间增加第三个实体,该实体取名为“借还书”,它的属性为:借还时间、借还标志(表示借书,表示还书),另外,它还应该有两个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。个数据库的设计技巧.主键的取值方法 是供程序员使用的表间连接工具,可以是一无物理意义的数字串,由程序自动加来
17、实现。也可以是有物理意义的字段名或字段名的组合。不过前者比后者好。当是字段名的组合时,建议字段的个数不要太多,多了不但索引占用空间大,而且速度也慢。个数据库的设计技巧.正确认识数据冗余 主键与外键在多表中的重复出现,不属于数据冗余,这个概念必须清楚,事实上有许多人还不清楚。非键字段的重复出现,才是数据冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的重复出现,而是字段的派生出现。例:商品中的“单价、数量、金额”三个字段,“金额”就是由“单价”乘以“数量”派生出来的,它就是冗余,而且是一种高级冗余。冗余的目的是为了提高处理速度。只有低级冗余才会增加数据的不一致性,因为同一数据,可能从不
18、同时间、地点、角色上多次录入。因此,我们提倡高级冗余(派生性冗余),反对低级冗余(重复性冗余)。个数据库的设计技巧.图没有标准答案信息系统的图没有标准答案,因为它的设计与画法不是惟一的,只要它覆盖了系统需求的业务范围和功能内容,就是可行的。反之要修改图。尽管它没有惟一的标准答案,并不意味着可以随意设计。好的图的标准是:结构清晰、关联简洁、实体个数适中、属性分配合理、没有低级冗余。个数据库的设计技巧.视图技术在数据库设计中很有用 与基本表、代码表、中间表不同,视图是一种虚表,它依赖数据源的实表而存在。视图是供程序员使用数据库的一个窗口,是基表数据综合的一种形式,是数据处理的一种方法,是用户数据保
19、密的一种手段。为了进行复杂处理、提高运算速度和节省存储空间,视图的定义深度一般不得超过三层。若三层视图仍不够用,则应在视图上定义临时表,在临时表上再定义视图。这样反复交迭定义,视图的深度就不受限制了。对于某些与国家政治、经济、技术、军事和安全利益有关的信息系统,视图的作用更加重要。这些系统的基本表完成物理设计之后,立即在基本表上建立第一层视图,这层视图的个数和结构,与基本表的个数和结构是完全相同。并且规定,所有的程序员,一律只准在视图上操作。只有数据库管理员,带着多个人员共同掌握的“安全钥匙”,才能直接在基本表上操作。请读者想想:这是为什么?个数据库的设计技巧.中间表、报表和临时表 中间表是存
20、放统计数据的表,它是为数据仓库、输出报表或查询结果而设计的,有时它没有主键与外键(数据仓库除外)。临时表是程序员个人设计的,存放临时记录,为个人所用。基表和中间表由维护,临时表由程序员自己用程序自动维护。个数据库的设计技巧.完整性约束表现在三个方面域的完整性:用来实现约束,在数据库设计工具中,对字段的取值范围进行定义时,有一个按钮,通过它定义字段的值城。参照完整性:用、表级触发器来实现。用户定义完整性:它是一些业务规则,用存储过程和触发器来实现。个数据库的设计技巧.防止数据库设计打补丁的方法是“三少原则”()一个数据库中表的个数越少越好。只有表的个数少了,才能说明系统的图少而精,去掉了重复的多
21、余的实体,形成了对客观世界的高度抽象,进行了系统的数据集成,防止了打补丁式的设计;()一个表中组合主键的字段个数越少越好。因为主键的作用,一是建主键索引,二是做为子表的外键,所以组合主键的字段个数少了,不仅节省了运行时间,而且节省了索引存储空间;()一个表中的字段个数越少越好。只有字段的个数少了,才能说明在系统中不存在数据重复,且很少有数据冗余,更重要的是督促读者学会“列变行”,这样就防止了将子表中的字段拉入到主表中去,在主表中留下许多空余的字段。所谓“列变行”,就是将主表中的一部分内容拉出去,另外单独建一个子表。这个方法很简单,有的人就是不习惯、不采纳、不执行。个数据库的设计技巧.提高数据库
22、运行效率的办法 在给定的系统硬件和系统软件条件下,提高数据库系统的运行效率的办法是:()在数据库物理设计时,降低范式,增加冗余,少用触发器,多用存储过程。()当计算非常复杂、而且记录条数非常巨大时(例如一千万条),复杂计算要先在数据库外面,以文件系统方式用语言计算处理完成之后,最后才入库追加到表中去。这是电信计费系统设计的经验。()发现某个表的记录太多,例如超过一千万条,则要对该表进行水平分割。水平分割的做法是,以该表主键的某个值为界线,将该表的记录水平分割为两个表。若发现某个表的字段太多,例如超过八十个,则垂直分割该表,将原来的一个表分解为两个表。()对数据库管理系统进行系统优化,即优化各种
23、系统参数,如缓冲区个数。()在使用面向数据的语言进行程序设计时,尽量采取优化算法。总之,要提高数据库的运行效率,必须从数据库系统级优化、数据库设计级优化、程序实现级优化,这三个层次上同时下功夫。项目实战项目实战议程 软件开发流程 程序员基本素质 关于质量控制和开发模板 项目组建设项目开发工作流程合同阶段()个性化开发阶段()合同签定用户个性化需求规格书标书分析方案书写产品化产品维护阶段()产品安装产品培训概要详细设计编码及文档用户测试单元测试集成测试n产品市场部n工程部开发组n工程部服务组n用户测试人员n软件开发生存周期项目结项、验收产品开发流程产品立项阶段()产品开发阶段()产品需求规格产品
24、总体设计产品市场调研产品立项申请产品化产品维护阶段()产品维护产品个性化修改概要详细设计编码及文档系统测试产品结项产品发行单元测试集成测试议程 软件开发流程 程序员基本素质 关于质量控制和开发模板 项目组建设程序员基本技能一、个人素质 信心和恒心 良好的个人品质 良好的个人习惯 二、职业素质交际能力表达能力职业素养 程序员的基本素质团队精神和协作能力 文档习惯 规范化,标准化的代码编写习惯 复用性,模块化思维能力 测试习惯 学习和总结的能力 .团队精神和协作能力 木桶理论 学习性组织.文档习惯 注释 开发过程文档:良好的文档是正规研发流程中非常重要的环节,作为代码程序员,的工作时间写技术文档是
25、很正常的,而作为高级程序员和系统分析员,这个比例还要高很多。缺乏文档,一个软件系统就缺乏生命力,在未来的查错,升级以及模块的复用时就都会遇到极大的麻烦。.规范化,标准化的代码编写习惯作为一些外国知名软件公司的规矩,代码的变量命名,代码内注释格式,甚至嵌套中行缩进的长度和函数间的空行数字都有明确规定,良好的编写习惯,不但有助于代码的移植和纠错,也有助于不同技术人员之间的协作。代码编写规范界面设计规范.复用性,模块化思维能力 用户控件 组件技术.测试习惯 单元测试 集成测试 系统测试 稳定性测试 软件研发作为一项工程而言,一个很重要的特点就是问题发现的越早,解决的代价就越低,程序员在每段代码,每个
26、子模块完成后进行认真的测试,就可以尽量将一些潜在的问题最早的发现和解决,这样对整体系统建设的效率和可靠性就有了最大的保证。.学习和总结的能力 学习:程序员是人才很容易被淘汰,很容易落伍的职业,因为一种技术可能仅仅在三两年内具有领先性,程序员如果想安身立命,就必须不断跟进新的技术,学习新的技能。总结:善于总结,也是学习能力的一种体现,每次完 成一个研发任务,完成一段代码,都应当有目的的跟踪该程序的应用状况和用户反馈,随时总结,找到自己的不足,这样逐步提高,一个程序员才可能成长起来。四、项目实践 软件工程理论 质量体系:和体系 基本理论 测试理论和测试工具使用 加密理论和加密方法 源代码控制工具使
27、用 说明书编写 程序的安装和部署 高级程序员的基本素质需求分析能力 项目设计方法和流程处理能力 复用设计和模块化分解能力 整体项目评估能力 团队组织管理能力 .需求分析能力 对于程序员而言,理解需求就可以完成合格的代码,但是对于研发项目的组织和管理者,他们不但要理解客户需求,更多时候还要自行制定一些需求,为什么这么说呢?.项目设计方法和流程处理能力 程序设计者必须能够掌握不少于两到三种的项目设计方法(比如自顶至下的设计方法,比如快速原型法等等),并能够根据项目需求和资源搭配来选择合适的设计方法进行项 目的整体设计。设计方法上选择不当,就会耽误研发周期,浪费研发资源,甚至影响研发效果。.复用设计
28、和模块化分解能力 一个成熟的软件行业,在一些相关项目和系统中,不同的部件是可以随意换装的,比如微软的许多桌面软件,在很多操作模块(如打开文件,保存文件等等)都是复用的同一套功能模块,而这些接口又通过一些类库提供给了桌面应用程序开发者方便挂接,这就是复用化的模块设计明显的一个佐证。.整体项目评估能力 作为系统设计人员,必须能够从全局出发,对项目又整体的清醒认识,比如公司的资源配置是否合理和到位,比如工程进度安排是否能最大化体现效率又不至于无法按期完成。评估项 目整体和各个模块的工作量,评估项目所需的资源,评估项目可能遇到的困难,都需要大量的经验积累,换言之,这是一种不断总结的累计才能达到的境界.
29、团队组织管理能力 首先是工作的量化,没有量化就很难做到合适的绩效考核,而程序量化又不是简单的代码行数可以计算的,因此要求技术管理人员需要能真正评估一个模块的复杂性和工作量。其次是对团队协作模式的调整,一般而言,程序开发的协作通常分为小组进行,小组有主程序员方式的,也有民主方式的,根据程序员之间的能力水平差距,以及根据项目研发的需求,选择合适的组队方式,并能将责权和成员的工作任务紧密结合,这样才能最大发挥组队的效率。议程 软件开发流程 程序员基本素质 关于质量控制和开发模板 项目组建设质量过程标准是什么,有什么用?开始并没有什么质量标准或者过程标准,但有些组织和企业呢,做的很成功,而有些则不成功
30、。那么有人就去分析为什么,这些组织和企业成功了呢?他们有哪些的共同的特征吗?答案是有,于是这些特征被归纳出来(比如中的立项,开发策划,中需求管理、配置管理等),并应用管理理论的成果,使之成为一种体系。他能做到什么和不能做到什么 当操作者有意识时,标准可以帮忙。假如你没做产品立项,或者作了,但没有市场分析报告,标准可以帮忙,因为会来说,这违背了规程,我们必须先做产品立项,并且必须基于市场分析报告。但大家没有意识时,比如产品立项时,假如与会人员多数认为没有市场,或者我们没有能力去做这个产品,但最终仍然立项通过,标准无能为力。如何应用标准?标准的目的?可控制 可追溯 开发模板 用户需求规格说明书 需
31、求评审报告 系统设计书 系统开发进度计划 项目验收标准 用户手册议程 软件开发流程 程序员基本素质 关于质量控制和开发模板 项目组建设项目组文档 编码规范 项目组守则 工作计划总结 使用规范 公共几类和常用代码使用一、版本管理的必要性 如果说年代的软件危机导致了软件工程思想的诞生和理论体系的发展,那么年代尤其是年代软件产业的迅猛发展导致了另一种新思想的产生和实现,这就是软件的版本管理。以往的那种被誉为具有良好编程风格的做法,诸如在对他人的源程序进行修改时注释修改原因,修改人和日期,如果是多个成员同时进行了修改,那么需要进行及时的人工的差异比较和综合以便形成一个统一的新版本。这种做法在当前的大型
32、软件的开发中已经越来越没有空间了,可以说是一种以小作坊的形式来面对软件的社会化大生产,再也不可能行得通了 Sourcesafe使用二、Visual SourceSafe 6.0(VSS 6.0)简介简介 Microsoft的VSS 6.0解决了软件开发小组长期所面临的版本管理问题,它可能有效地帮助项目开发组的负责人对项目程序进行管理,将所有的项目源文件(包括各种文件类型)以特有的方式存入数据库。开发组的成员不能对该数据库中的文件进行直接的修改,而是由该版本管理器将该项目的源程序或是子项目的源程序拷贝到各个成员自己的工作目录下进行调试和修改,然后将修改后的项目文件作Checkin提交给VSS,由它进行综合更新。