1、热电车间热电车间(维修维修)自动控制系统自动控制系统 应急预案应急预案 审批: 审核: 编制: 20180915 发布发布 20180916 实施实施 生生 产产 技技 术术 部部 热热 电电 车车 间间 (维修维修) 发布发布 前前 言言 本本预案预案第一次发布第一次发布 本预案由热电车间本预案由热电车间(维修维修)提出提出 本预案起草人:本预案起草人: 本预案审核:本预案审核: 本预案审批:本预案审批: 本预案由热电车间本预案由热电车间(维修维修)负责解释负责解释 目目 录录 1总则4 1.1 编制目的4 1.2 编制依据4 1.3 适用范围4 2系统故障对生产影响分析5 2.1 故障起因
2、 2.2 影响程度分析 3组织机构及职责 3.1 自动控制系统应急指挥领导小组 3.2 应急专业组 3.3 组织机构职责 4.系统电源全部失去应急处置 4.1 故障现象 4.2 工控系统检查 4.3 原因分析 4.4 维护处理 5. 操作员站全部失去监控且无后备监视手段应急处理 5.1 故障现象 5.2 故障原因 5.3 维护处理 6. DCS/PLC 网络瘫痪应急处置预案 6.1 故障现象 6.2 故障原因 6.3 故障分析及处理 7. DCS/PLC 冗余服务器故障应急处置预案 7.1 故障现象 7.2 控制系统检查 7.3 故障分析 7.4 故障维护处理 8. 系统单路电源失去应急处置预
3、案 8.1 故障现象 8.2 控制系统检查 8.3 故障分析 8.4 故障维护处理 9. 网络失去冗余应急处置预案 9.1 故障现象 9.2 控制系统检查 9.3 故障分析 9.4 故障维护处理 10. 系统重要 I/O 设备(模件、模块)故障应急处置预案 10.1 故障现象 10.2 控制系统检查 10.3 故障分析 10.4 故障维护处理 1 1总则总则 1.11.1 编制目的编制目的 为及时、有效、迅速地处理自动控制系统故障事件,避免因控制系统故 障导致生产工艺系统非停或可能造成的重大设备损坏事故,制定控制系统应急预 案。 1.21.2 编制依据编制依据 工业自动化和控制系统网络安全 集
4、散控制系统(DCS) 第2部分: 管理要求 (GB/T 33009.2-2016 ) 1.31.3 适用范围适用范围 本预案所称自动控制系统是指在我公司生产过程中所使用的过程控制计 算机系统(DCS) 、可编程控制器系统(PLC)。 2 2系统故障对生产系统故障对生产工艺工艺影响分析影响分析 2.12.1 故障起因故障起因 系统本身问题,包括设计安装缺陷、软硬件故障等。人为因素造成的故 障,包括人员造成的误操作,管理制度不完善及执行环节落实。系统外部环 境问题造成 DCS/PLC 故障。如环境温度过高、湿度过高或过低、粉尘、振动 等因素造成异常。 2.22.2 影响程度分析影响程度分析 由于生
5、产中涉及到的原材料和反应较多,对环境也有着较高的要求,所 以要对生产过程和生产环境进行严格的控制,以避免安全事故的发生。 DCS/PLC 控制系统,能够对化工生产实行全面、系统的管理,提高化工生产 的安全性和稳定性,将事故的发生概率降到最低。工控系统发生事故,能够 在第一时间采取应急措施,能有效防止事故的扩大和蔓延,减少公司经济损 失。 3 3组织机构及职责组织机构及职责 3.13.1 自动控制系统应急指挥领导小组自动控制系统应急指挥领导小组( (下称领导小组下称领导小组) ) 组长:热电车间主任 副组长:热电车间仪表运行主任 组员:仪表专业工程师 3.23.2 应急专业组应急专业组 抢修组:
6、仪表维护各班组 联络组:各值值长 调查组:热电车间相关人员 技术专家组:领导小组成员及各部门相关人员 3.33.3 组织机构职责组织机构职责 3.3.13.3.1 领导小组职责领导小组职责 发生工控系统故障时,启动应急预案。指挥各专业班组进行应急处 置工作;做好各项应急处置工作,及时有效地控制事故,防止事故蔓延 扩大;研究协调解决事故应急处理工作中的具体问题;做好工控系统事 故的善后处理工作。 3.3.23.3.2 抢修组职责抢修组职责 发生工控系统故障时,第一时间赶赴现场处理,并及时向领导小组 成员汇报。在现场采取有效措施防止事态扩大。 3.3.33.3.3 联络组职责联络组职责 负责协调联
7、络各工种、专业、小组成员,保证事帮不进一步扩大。 3.3.43.3.4 调查组职责调查组职责 事后认真调查事故的起因、经过、结果,调取生产过程曲线,分析 故障原因,评估事故影响,做出结论,下达整改措施。 3.3.53.3.5 技术专家组职责技术专家组职责 负责对事故的技术支持,参与事故原因调查工作;负责对事故进行 分析评估。提出决策建议,参与应急处理。 4.4.系统电源全部失去应急处置系统电源全部失去应急处置 4.14.1 故障现象故障现象 全部操作员站显示黑屏且独立控制系统供电电源失去报警装置发生 声音报警。 全部服务器停止工作。 全部交换机停止工作。 全部 I/O 控制站停止工作。 4.2
8、4.2 工控系统检查工控系统检查 工程师站电源失去,显示器全部失电显示为黑屏。 电子间内电源柜电源失去,电源指示为零。 控制系统所有模件柜指示灯熄灭,主机柜内控制器电源、交换机、控 制器的所有指示灯均熄灭。 4.34.3 原因分析原因分析 全部操作员站失去操作与监视,全部控制器停止工作,造成失电控制 器所涉及的设备拒动或误动,导致机组跳闸,甚至因设备拒动或误动 而损坏设备。 4.44.4 维护处理维护处理 (1)自动控制人员到控制系统总电源柜检查两路进线电源是否为 220VAC,如果不正常,由电气专业检查并恢复。 (2) 如果进线电源为正常 220VAC, 自动控制人员检查控制系统总电源柜 内
9、送各机柜空气开关状态,用万用表检查到各机柜电源出线是否有 接地现象, 若有, 检查消除接地点, 再准备恢复自动控制系统供电。 如果进线电源为正常 220VAC, 且机柜电源出线无接地现象, 则检查 DCS/PLC 侧切除装置是否故障,若故障则更换切换装置,若无法及 时更换,紧急情况下可先将其隔离,先进行系统上电工作,待系统 恢复后再尽快更换。 (3)自动控制人员确认可以恢复 DCS/PLC 供电时,应汇报值长无运行及 维护人员进行现场工作后,方可对 DCS/PLC 进行重新上电。恢复上 电前应先将 DCS/PLC 系统各设备的空气开关打至断开状态,然后从 上级向下级的顺序进行送电工作。 (4)
10、DCS/PLC 重新送电后,自动控制人员确认 DCS/PLC 功能全部恢复, 检查设备状态、参数指示正常,汇报值长决定是否重新开机。 5. 5. 操作员站全部失去监控且无后备监视手段应急处理操作员站全部失去监控且无后备监视手段应急处理 5.15.1 故障现象故障现象 (1)全部操作员站数据显示黑屏。 (2)全部操作员站响应缓慢。 (3)全部操作员站死机,失去监控作用。 5.25.2 故障原因故障原因 (1)操作员站全部电源失去。 (2)监控网络全部故障。 (3)服务器全部故障。 5.35.3 维护处理维护处理 (1)立即至 DCS/PLC 总电源柜检查 DCS/PLC 电源,参照系统电源全部
11、失去应急处置预案进行处理。 (2)检查 DCS/PLC 网络,若为网络原因,参照 DCS/PLC 网络瘫痪应急 处置预案进行处理。 (3)检查服务器运行状况,若为服务器全部故障,参照 DCS/PLC 冗余 服务器均故障应急处置预案进行处理。 6. DCS/PLC6. DCS/PLC 网络瘫痪应急处置预案网络瘫痪应急处置预案 6.16.1 故障现象故障现象、检查、检查 (1)操作员站可以显示画面,但切换流程图非常缓慢,操作员站上操 作影响延迟很大或数据显示严重超时。 (2)全部操作员站离线,运行人员在这些离线的操作员站上操作无响 应或全部参数不更新丧失监控功能。 (3)工程师站的系统监视画面上,
12、全部工作站或者控制器显示离线。 (4)交换机柜内交换机全部端口指示灯熄灭或者变为黄色。 (5)DCS/PLC 网络存在数据风暴或网络病毒。 6.26.2 故障原因故障原因 (1)交换机全部故障。 (2)冗余装置的服务器全部故障。 (3)网络数据风暴或网络病毒引起。 6.36.3 故障分析及处理故障分析及处理 全部操作员站无法准确控制机组运行状态,停机停炉,甚至损坏机组 设备。 (1)检查上层网络交换机电源模块运行指示灯,若不亮或闪烁则说明 交换机电源问题,检查交换机电源回路并进行处理。 (2)检查交换机,看是否硬件故障。 (3)检查 I/O 服务器或交换机冗余网络是否正常,查看是否有数据风 暴
13、或网络病毒。 (4)检查服务器运行状态,若冗余服务器故障,则处理故障服务器并 上报,立即启动 DCS/PLC 冗余服务器均故障应急处理。 (5)系统恢复过程中随时与值班运行人员沟通,汇报系统恢复进度, 以备运行人员做好相应的恢复措施。 (6)系统恢复后,检查 DCS/PLC 各节点工作状态是否正常,若不正常 及时处理;若正常,通知运行人员可根据操作员检查各画面参数 是否与就地设备状态一致,并决定是否可以正常操作。 7. DCS/PLC7. DCS/PLC 冗余服务器故障应急处置预冗余服务器故障应急处置预案案 7.17.1 故障现象故障现象 (1)全部操作员站无响应。 (2)全部数据不刷新,全部
14、控制设备(如泵、风机、调节阀)操作无 效。 (3)所有趋势、报警、报表异常。 7.27.2 控制系统检查控制系统检查 (1)系统状态无法调用。 (2)服务器连接的网络图标异常。 (3)全部服务器已关机,电源失去。 7.37.3 故障分析故障分析 (1)连接服务器的网络或网络设备故障 (2)服务器电源全部故障 (3)服务器部分或全部任务故障退出。 (4)服务器主机硬件故障 (5)服务器应用程序异常 (6)监视画面无法监事和操作。 (7)趋势、报警、报表功能异常。 7.47.4 故障维护处理故障维护处理 (1)检查与服务器相连的网络,若为网络原因则进行处理。 (2)检查服务器电源是否正常 (3)检
15、查服务器运行的任务是否有异常。 (4)登陆服务器检查软件运行情况,若服务器全部死机,直接进入服 务器硬重启。 (5)检查服务器主机硬件,若硬件故障则更换服务器,在更换服务器 前应先确认服务器 IP 地址、配置文件设置正确无误后下装服务 器。 (6)系统恢复过程中随时与当值人员沟通,汇报系统恢复进度,以备 运行人员做好相应的恢复措施。 (7)通过操作员站在线查看服务器工作状态,当所有显示正常后,程 序自动启动完毕,通知运行人员可根据操作员站检查各画面参数 显示是否与就地设备状态一致,并决定是否可以正常操作。 8. 8. 系统单路电源失去应急处置预案系统单路电源失去应急处置预案 8.18.1 故障
16、现象故障现象 (1)独立的 DCS/PLC 供电电源失去报警装置发失电声音报警。 (2)DCS/PLC 设备报警画面中所有控制站单路系统电源失去报警。 8.28.2 控制系统检查控制系统检查 (1)系统状态图中 I/O 控制站一路视点报警。 (2)所有冗余配置的电源模件系统其中一路显示红色故障。 (3)DCS/PLC 所有模件柜中一路电源模件指示灯熄灭。 8.38.3 故障分析故障分析 (1)保安段电源单路失电。 (2)UPS 电源单路失电。 (3)电源柜内单路空气开关跳闸 系统已失电,系统运行风险增大,若此时另一路电源不能保证正常供 电,将会导致事故扩大。 8.48.4 故障维护处理故障维护
17、处理 (1)运行人员立即通知自动控制维护人员处理,此时 DCS/PLC 系统已 单路失电, 应保持工况稳定, 减少操作, 密切监视机组运行情况, 在切除部分负载前明确确认。同时必须做好两路电源均失去的风 险控制措施。 (2)自动控制维护人员根据故障报警准确判断电源失电的部位,到 DCS/PLC 总电源柜检查该路电源是否为 220VAC,如果不正常,由 电气专业人员检查并恢复正常供电。 (3)当失电是否由于电源柜内单路空气开关跳闸引起,则立即检查空 气开关是否正常,若不正常应立即进行更换;更换完毕后,经过 试验确定正常后,再进行系统上电工作。 9. 9. 网络失去冗余应急处置预案网络失去冗余应急
18、处置预案 9.19.1 故障现象故障现象 设备报警中出现相关网络故障报警。 9.29.2 控制系统检查控制系统检查 (1)系统状态图中显示局部网络故障。 (2)单路交换机电源失去,状态指示灯异常。 (3)单路交换机数据风暴。 9.39.3 故障分析故障分析 (1)单路网络交换机故障 (2)单路网线松动或短路 (3)网卡故障 9.49.4 故障维护处理故障维护处理 (1)运行人员立即通知自动控制维护人员处理,此时网络已失去冗余, 应保持工况稳定,减少不必要的操作,密切监视机组运行情况,同 时必须做好双网络均失去的风险预控措施。 (2)通过故障现象判断故障的网络位置。 (3)检查相关的网络交换机,
19、检查交换机的状态指示灯,若所有的指示 灯均不亮,则检查该路交换机底板或与之连接的接口和电源是否正 常,若不正常,更换网线或交换机,并将各端口接线恢复至更换前 状态;若正常,应进一步检查是否存在网络风暴。故障处理过程中 注意避免同时中断冗余配置的两端网络。 10. 10. 系统重要系统重要 I/OI/O 设备(模件、模块)故障应急处置预案设备(模件、模块)故障应急处置预案 1010.1.1 故障现象故障现象 (1)故障模件数据不刷新或显示错误,部分或全部控制设备(如泵、 风机、调节阀)操作无效。 (2)设备报警中模件或模块通道故障报警。 1010.2.2 控制系统检查控制系统检查 (1)I/O
20、模块状态图中该设备显示异常。 (2)控制柜内 I/O 模块 run 灯不亮,模件硬件故障。 (3)控制柜内 I/O 模块 com 灯不亮,模件通讯故障。 1010.3.3 故障分析故障分析 故障 I/O 模块所对应的部分或全部设备无法正常监控。 (1)外界因素(强电、雷击)引起 I/O 设备故障。 (2)电子间环境因素(温度、湿度、灰尘)引起 I/O 设备故障。 (3)I/O 模块质量问题或者元器件老化。 (4)模块通讯故障。 1010.4.4 故障维护处理故障维护处理 (1)撤除相关联锁、保护和自动。 (2)如有必要则要求自动控制维护人员强制相关信号。 (3)运行人员暂停或减少相关设备的操作。 (4)在工程师站上通过状态图、报警信息及现场实际状态显示确定故 障的 I/O 模块,并进行故障处理。 (5)根据 I/O 清册查出 I/O 设备内的所有信号,并列出保护、自动调 节的信号清单提示运行人员做好必要的隔离和防误动措施。 (6)检查故障 I/O 设备数据通讯。 (7)检查故障 I/O 设备供电电源。 (8)检查接线端子排是否故障,测量模件输入输出信号,在限号正常 的情况下更换到备用通道,如不能恢复,更换接线端子排。 (9)检查 I/O 模块是否故障,若故障及时更换,在更换模块时应先确 定模块的信号、版本等正确无误。