业务连续性计划(BusinessContinuityPlanning,缩写为BCP)的概念理解:
业务连续性计划是一套基于业务运行规律的管理要求和规章流程,使一个组织在突发事件面前能够迅速作出反应,以确保关键业务功能可以持续,而不造成业务中断或业务流程本质的改变。
业务连续性是指企业有应对风险、自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下三个方面。
- 高可用性(Highavailability)。它是指提供在本地故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施,还是IT软硬件故障。
- 连续操作(Continuousoperations)。它是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。
- 灾难恢复(DisasterRecovery)。它是指当灾难破坏生产中心时,在不同的地点恢复数据的能力。
同时,上述三个部分不是相互孤立的,是相互关联,而且有交叉的。
区分业务连续性和灾难恢复是很必要的。严格地说,灾难恢复是恢复数据的能力,是业务连续性计划的一部分。
备注说明:
让业务连续性计划成为企业变化管理文化的一部分。在制定企业业务连续性计划之后,不要把这个计划放在一边。要确保该计划的切实可行,就需要把它变成活动的文档。如果企业的业务模式发生了变化,或是业务过程进行了重新设计,或是发生突发状况时的重要联系人不再为公司工作,旧的计划就需要及时进行更新。当有变化时,每个员工都应该问问自己该变化会对业务连续性计划中涉及到自己的部分会产生怎样的影响。
一、业务连续性计划(BCP)的内容
业务连续性计划既可以分成几个单独的计划:即预防、响应、业务接续、业务恢复和复原计划,也可以由每一个这样的计划构成总的计划书中的不同章节。
1.基本要求
目的:制定计划的目的必须加以说明。还应该说明即划分几个阶段试时,每个阶段所要实现的目标是什么。
范围:说明有哪些部门和运营业务需要实施BCP。如果一个BCP只针对某些灾难而非全部灾难,则需要针对这些特殊灾难制定专门的实施处理脚本。
必备条件/前提条件和限制因素:形成一份BCP的前提条件需要在此说明。在某些情况下,还须说明BCP成功的必备条件。比如说,服务器的数据备份间隔不得超过多少小时,受过训练的运营恢复团队必须呼之即来,备选场所必须在灾难发生之后多少小时之内一切准备就绪等等。如果BCP计划的执行还存在一些限制条件的话,也应在此列出。
团队:BCP团队的组织/负责人选、下属哪些分支团队、团队的作用和责任等,都必须在此说明。
指标:作为一种策略,企业必须由用于恢复的RPO和RTO指标,以及性能指标等,这些指标应该在此加以说明,并向客户和股东说明。
2.预防保护
作为BCP中的一个实施部分,预防措施需要在此说明。这些措施可以概括如下:
- 监督
- 访问控制
- 身份认证
- 防病毒
- 过滤
- 入侵检测系统
- 备份计划
3.紧急响应
响应的准备:在响应阶段需要哪些资源应当在此列出,同时详细申明这些资源的配置和所需数量。如果还需要一些文档和记录的硬拷贝,也必须在此申明。
- 告知树
- 危险评估
- 何时对外宣布
- 激活BCP的关键标准
4.业务接续
从紧急响应阶段到业务接续阶段如何进行衔接是需要在这里说明的。有关业务接续运营的决策过程、在哪里以及怎样进行业务接续、需要采取什么行动,以及接续哪些业务到何种程度等等,都需要在此加以说明。还要为BCP团队中的各个小组指定各自应该采取的行动,每个小组要完成指定的任务。BCP中的这一部分也称为业务接续计划(BRP)。
5.业务恢复
执行业务恢复的程序在此加以说明。BCP的这一部分也可称为灾难恢复计划(DRP)。
这一部分计划文档的组织可以有很多种方式。一种方式就是简单地列出所有的恢复目标(按照RPO、RTO、目标服务器/网络等来列)。根据每一目标进行计划分解,同时明确相应的团队/负责人以及任务。还有一种方式就是按部门来组织。无论采用哪种方式,都应确保所有的BCP目标都能覆盖到。
计划的这一部分必须编排得像一本操作手册,由一系列简单明确的指令构成,恢复团队完全可以按照这些指令进行恢复操作。各种操作之间的相互关系也必须加以明确说明。所有的指令和说明必须明白无误,以免因可能引起误解或不明了而导致时间损失。
6.复原
为业务运营复原原有场所应采取的步骤在此加以说明。需要标明每个团队/负责人的责任和任务。
二、业务连续性计划(BCP)的实施流程
BCP运作共有6个阶段,分别为:1、项目初始化、2、风险分析及业务影响、3、策略及实施、4、BCP开发、5、培训计划、6、测试及维护。
1、项目初始化
- 获得管理层的支持与投入
为了确保该程序能够成功,高级管理层必须参与其中。BCP计划必须成为公司的战略性业务计划之一。同时,公司必须设定合理预算,并为BCP提供独立的预算。
- 建立团队
必须建立一个团队,人员包括财务部,审计部,信息技术部,人事部,行政部等等。当灾难开始时,这些部门在继续扮演他们承担的支援角色的同时,也必须实施重大的机构转变以援助受影响的区域。法律部、公关部与投资部在事件发生后需要向公众及股东通告公司的运作状况。
2、风险分析及业务影响分析
2.1 决定BCP需求的关键驱动力是“企业能在灾难中承受多少金额的损失”?业务影响分析的目的是回答以下问题:
- 保护何种资产?(资产识别与评估)
- 资产的威胁与脆弱点?(脆弱点和威胁评估)
- 有没有控制措施?控制措施能否预防或减少潜在的威胁?(评估控制)
- 投入金额/劳力的多少?(决定)
- 投入资金的效率如何?(通讯和监控)
2.2 当进行业务影响分析时,应考虑以下几方面:
- 金额的影响:如果不采取相应的措施,则组织的经济损失是多少?
- 客户的影响:如果发生业务中断,则组织会损失多少市场占有率
- 法律的影响:组织是否遵从法律的要求?
- 内部依赖关系的影响:中断的业务是否会其他领域的关键业务?
2.3 作为业务影响分析的一部分,应该评估业务允许中断的时间长短;组织能提供多常时间的信息;当信息重新可用时,允许损失的信息是多少?这些问题可以通过恢复时间目标(recoverytimeobjective(RTO))和恢复点目标(recoverypointobjective(RPO))来决定。
2.4 决定BCP需求的另一个因素是“灾难实际发生的可能性”。此因素由威胁的级别和组织具有的薄弱点范围决定,威胁的程度取决于下列因素:
- 有恶意性的破坏,如轰炸、纵火、工业间谍等。
- 意外事故,如组织的办公场所、环境,内部系统和处理程序的质量。
3、业务持续性策略及实施
3.1 业务持续性策略:
业务影响分析为制定业务持续性策略提供必要的信息,下来,根据提供的信息,可以确定多种满足组织业务持续管理的方案。必须为各种业务持续方案进行成本、效益及风险分析,包括:
- 满足业务持续目标的能力
- 影响的可能性
- 安装设备的成本
- 维护、测试及调用设备的成本
- 中断对于技术、组织、文化和管理的干扰及未采取持续管理的潜在影响
应该仔细考虑采取业务持续方案确实解决了具体的风险但不会增
加其它风险。通过风险降低和业务持续方案成本的平衡来决定业务持续策略以降低风险达到业务持续的目标。
3.2 实施:设立组织及准备实施计划书
- 实施备份安排
- 实施降低风险的措施
4、BCP开发
4.1 开发业务持续性计划之前,确定灾难发生的情况下执行的行动,你需要熟悉每天的操作任务。这意味这你需要熟悉每一个业务处理过程的基本文档。在开发业务持续性计划之前,须考虑下列措施是否已经存在:
- 变更控制流程
- 最终用户的标准操作流程
- 操作人员的具体需求和特殊外围设备需求
- 数据流图表及问题管理程序
- 重要记录
- 磁带备份/记录管理日常安排
- 异地存储
4.2 开发BCP计划时,需考虑在计划执行的七个阶段中为每个恢复小组分派任务:
- 评估与声明
- 通告
- 应急反应
- 过渡期处理
- 抢救
- 重新安置及启动
- 重新正常运做
5、培训计划
一些员工需要的特殊培训如下:
- 有紧急情况时可应用替代的技术流程
- 当自动操作系统正在恢复时可替代的人工操作流程
- 确保团队成员达到推动BCP所需能力的技术培训
6、测试及维护
进行演示及有规律的测试,增强信心及效率,确保其相关的文档时常更新。
6.1 BCP的测试
制定好的BCP需要进行适当地测试才能投入使用。这一过程必须经常周期性地进行。省略了这一过程就意味着BCP只能等灾难实际发生之后进行实地测试,这样做的风险太大,恐怕任何一家企业都不敢做这种尝试。
规划一次BCP测试需要规定以下事项:
- 测试脚本——将可能发生的灾难定义为测试的一个部分。
- 测试计划——定义检查程序、各种测试脚本、任务的类型、任务的参与者,比如说主要团队或者主要团队与预备团队的混合行动。
简而言之,在测试BCP时,需要执行下列行动
- 准备一份测试计划,选择测试脚本,说明预期要达到的结果。
- 执行该计划
- 记录测试结果
- 评估测试结果,报告存在差距
- 将测试结果和报告向团队公布
- 确认需要做何改进以弥补差距
- 培训团队
6.2 BCP的维护
一个BCP必须周期性地加以检查和维护。一旦有新的系统、新的业务流程、或者新的商业行动计划加入企业的生产系统或者信息系统,引起企业整体系统发生变化时,就更应该强制启动这种检查程序。除此之外,像联系人名单的更改这样微小的变动都可能触发BCP计划的更新。
每一次在进行这种检查程序时,最好是与对BCP的改进相互结合。例如,在测试过程中发现的问题、企业为了实现连续性对机构所作的调整,或者在保持业务连续性测试时发现了更好的行动方式和计划等等。因此,BCP的维护应该是变化和改进的结合与不断促进。
每一次对BCP计划所作的改动都应该及时通知所有的BCP团队,并具体落实到每一次的培训和测试过程中去。
最后,与业务连续性相关的资源——人和设备——也会受到维护的影响。人员会通过培训和测试程序受到影响,设备会通过维护程序受到影响。只有当这些资源始终处于良好状态,才能在危机发生时成为可靠和可依赖的资源。
公司没有业务持续计划就象是不设防,不可能阻止任何不可预测的破坏所造成的各种损失。所以公司必须认真的对待业务持续计划。


