在当今高度互联的世界中03e向客户表明企业致力于提供可靠的服务,即使在意外事件发生时也是如此。
结论
在当今数字世界中,云服务器灾难恢复计划对于确保业务连续性至关重要。通过制定和实施一个全面的计划,企业可以保护其关键数据、最大程度地减少停机时间,并提高面对意外事件时的恢复能力。通过遵循本文概述的步骤和考虑好处,企业可以制定一个有效的灾难恢复计划,为意外事件做好充分准备,并确保业务持续运营。
云服务器能做什么
云服务器(Elastic Compute Service, ECS),作为一种高效、安全、灵活的计算服务,具有广泛的应用场景。
以下是云服务器能够执行的一些主要功能和应用:弹性扩展:云服务器可以根据业务需求进行弹性扩展,即根据负载情况自动增加或减少计算资源,如CPU、内存和存储空间,以满足业务增长或应对突发流量。
数据存储与备份:云服务器提供可靠的数据存储服务,支持海量数据的存储,并具备数据备份和恢复功能,确保数据的安全性和完整性。
开发与测试环境:为开发人员提供快速、灵活的环境,用于创建和部署应用程序的开发和测试环境,加速软件开发周期。
网站和应用托管:云服务器可用于托管网站、在线应用和游戏服务器等,提供稳定、高效的服务,支持高并发访问和数据处理。
人工智能与机器学习:云服务器在AI和机器学习领域发挥着重要作用,提供强大的计算能力和存储资源,支持复杂的算法训练和数据分析。
虚拟化和容器化:支持虚拟机和容器的创建与管理,实现资源的灵活分配和高效利用。
网络功能与安全:云服务器通过云服务提供商的网络基础设施进行连接,支持多种网络功能,如负载均衡、安全组配置等,确保数据传输的安全性和可靠性。
灾难恢复与业务连续性:通过在不同地理位置的数据中心复制数据和应用程序,云服务器提供灾难恢复和业务连续性服务,确保在灾难发生时能够迅速恢复业务运营。
综上所述,云服务器凭借其弹性扩展、数据安全、高效开发、稳定托管、智能支持、灵活虚拟化、网络功能强大以及灾难恢复能力强等特点,在各个领域发挥着重要作用。
案例分享-BCP业务连续性计划
在业务连续性计划(BCP)的实施过程中,我们通过一个具体的案例来深入探讨BCP的关键要素及其实际应用。
业务连续性计划是确保在面临灾难、突发事件时,公司关键业务功能能保持运行的策略。
业务连续性计划的核心内容包括了为关键功能提供人力、物力支持,以及确保在最低服务水平下实现连续性。
以某项目为例,我们发现公司的容灾管理规定明确要求每季度对人员和联系方式进行变更检查及维护,这是BCP的重要组成部分,以确保在发生紧急情况时能及时联系到相关人员。
然而,通过查阅《BCP业务连续性计划》文件,我们发现并未严格执行这一规定。
实际上,所列示的应急联络人在近期已经离职,这无疑将对评估灾难及执行恢复计划造成重大影响,尤其是当需要进行计划的测试和执行时,无法有效联系到关键责任人。
此外,根据监管规定,公司应定期执行有效的业务连续性计划,并组织演练以确保流程顺畅可行。
在检查公司组织的灾难恢复演练记录时,我们发现部分定义为重要业务的交易系统并未进行演练,或者演练的充分性不足。
对于这些重要业务系统而言,未进行充分演练意味着各部门对在灾难恢复中的职责和操作不够明确,也无法验证计划的有效性。
通过这个案例,我们可以看到在BCP实施过程中,定期检查和维护、充分的演练以及确保关键联系人的有效性是至关重要的。
只有这样,我们才能在面对不可预见的灾难或突发事件时,保持关键业务功能的连续运行,并确保公司能够在最短的时间内恢复运营,减少潜在的损失和影响。
云计算灾备:灾备通识
目录
一、灾备的定义
灾备指的是用现有的科学技术手段和方法,提前建立起可靠的应急方式,来应对突发事件的发生。
灾备包括容灾系统和备份系统。
备份:
保障数据的安全性
,备份指的是将全部或部分数据集合从生产主机硬盘或阵列中保存到其他的存储介质的过程。
容灾:
保障业务的连续性
,容灾指的是在较远的异地建立两套或者多套相同的、包含完整基础设施(计算、网络、存储、电力制冷等)的IT系统,通过网络的方式实现数据的传输,当主数据中心发生故障,可以利用备数据中心快速恢复业务。
保护对象 :备份保护的是
数据
,容灾保护的是
业务连续性
。
实现方式 :备份采用备份软件技术实现,而容灾通过复制或者镜像软件实现。
时间周期: 数据保护的周期不一致,复制或者镜像的时间周期更短。
补充:归档使用的是备份。
只有备份:
如果只有备份,业务无法快速恢复,数据恢复需要时间,这段时间对某些行业带来的损失是无法估量的。
另外,备份一般是周期性执行的,一旦发生数据丢失,从恢复复时间到上次备份时间之间的数据就会丢失。
只有容灾:
如果只有容灾,业务可以快速恢复,数据也可以被保护,但是生产段有错误的操作,或者系统升级失败之类的,也会被同步到容灾端,从而造成业务的中断。
(数据是无价的,丢了的话问题很大哇!)
云服务器备份服务(CSBS): Cloud Server Backup Service,为云服务器提供整机备份功能,支持基于多云硬盘一致性快照技术的本地备份,以及对备份数据的远程复制,并支持利用备份数据恢复云服务器数据,最大限度保障用户数据的安全性和正确性,确保业务安全。
云硬盘备份服务(VBS): Volume Backup Service,基于云硬盘的备份服务。
用户可为云硬盘创建备份,利用备份数据回滚云硬盘,以最大限度保证用户数据正确性和安全性。
同步复制: 实时同步进行复制。
异步复制: 异步复制数据,数据一致性有待商榷。
本地生产中心:
同城容灾方案(<100km):
异地容灾方案(>100km):
优点:
本地高可用: 本地高可用通常为近距离的同一个机房内,使用
实时镜像
和
同步复制
的方案,由于带宽和距离很近,通常要求RPO=0。
优点:
关键技术: HyperReplication
优点:
关键技术: HyperMetro
补充:
备份窗口 :它指用户正常使用业务系统不受影响的情况下,能够对业务系统中的业务数据进行数据备份的时间间隔,或者说是用于备份的时间段。
完全备份: 又叫全量备份,对某一时间点上的所有数据的一个完全拷贝。
备份发起后变更的数据将在下一次进行备份,又称为全量备份。
累积增量式备份:
以上一次完全备份为基准
进行备份,若之前从未进行过备份,则备份所有数据。
差异增量式备份:
以上一次备份为基准
进行备份,若之前从未进行过备份,则备份所有文件。
恢复点目标(RPO): 当业务发生故障时,可以容忍
数据丢失的数量
,单位为时间。
举例:8点进行备份,9点丢数据,RPO=1小时,丢了一个小时的数据。
恢复时间目标(RTO): 当业务发生故障时,可以容忍
业务中断的时间
,单位为时间。
举例:比如灾难发生后半天内需要恢复数据,那么RTO就是12小时。
RTO/RPO 与灾难恢复能力等级关系(GB/T -2007)
这个在备份组网那一块再详细补充…
这里参考:图解三种备份方式(LAN,LAN free,Server free)_star&storage的技术博客_51CTO博客
LAN-Base,这种方式很简单,直接在生产服务器上安装备份代理,部署一台备份服务器,这样即可完成备份,不过这种方式不适合数据量非常大的环境。
因为如果备份数据量非常大,会占用以太网的带宽,虽然说备份操作一般在晚上进行。
但是这种方式还是不适合大数据量的情况。
因此有了LAN-Free备份。
LAN-Free,顾名思义,即释放了LAN的压力。
如上图所示,数据流直接从File server经过FC switch备份到Tape,而不经过Lan,这样就不会占用主网络的带宽。
但是数据仍然会通过文件服务器的本地磁盘–内存—FC switch这步,因此仍然会消耗File server的资源。
因此有了下面的Server Free备份来尽可能的减少生产服务器的压力。
Server-Free,即备份时数据不流经服务器的总线和内存,如上图,文件服务器使用SAN的File Server Storage空间,现在需要备份文件服务器,则只需将File Server Storage的数据直接备份到Tape。
此时文件服务器只需要发出SCSI扩展复制命令,剩下的事情就是File Server Storage和Tape之间的事情了,这样就减轻了文件服务器的很多压力,使它可以专注于对外提供文件服务,而不需要再消耗大量CPU、内存、IO在备份的事情上了。
或者还有一种方式即NDMP,Network Data Management Protocol,网络数据管理协议。
它是一种支持智能数据存储设备、磁带库设备及备份应用程序之间互相通信以完成备份过程的通信协议。
服务器只要向支持NDMP协议的存储设备发送NDMP指令,即可让存储设备将其自己的数据直接发送到其他设备上,而不需要流经服务器主机。
主机层数据复制: 在生产中心和灾备中心的服务器上安装专用的数据复制软件,如卷复制软件,以实现远程复制功能。
两中心间必须有网络连接作为数据通道。
可以在服务器层增加应用远程切换功能软件,从而构成完整的应用级容灾方案。
这种数据复制方式相对投入较少,主要是软件的采购成本;兼容性较好,可以兼容不同品牌的服务器和存储设备,较适合硬件组成复杂的用户。
但这种方式要在服务器上通过软件来实现同步操作,占用主机资源和网络资源非常大。
网络层数据复制: 在生产中心和灾备中心的服务器上安装专用的数据复制软件,如卷复制软件,以实现远程复制功能。
两中心间必须有网络连接作为数据通道。
可以在服务器层增加应用远程切换功能软件,从而构成完整的应用级容灾方案。
这种数据复制方式相对投入较少,主要是软件的采购成本;兼容性较好,可以兼容不同品牌的服务器和存储设备,较适合硬件组成复杂的用户。
但这种方式要在服务器上通过软件来实现同步操作,占用主机资源和网络资源非常大。
存储层数据复制: 要实现数据的复制需要在生产中心和灾备中心都部署一套这样的存储系统,数据复制功能由存储系统实现。
如果距离比较近(几十公里之内),之间的链路可由两中心的存储交换机通过光纤直接连接;如果距离在200公里内,可通过增加DWDM等设备直接进行光纤连接;超过200公里,则可增加存储路由器进行协议转换途径WAN或Internet实现连接。
因此,从理论上可实现无限制连接。
在存储层实现数据复制功能是很成熟的技术,而且对应用服务器的性能基本没有影响。
目前,这种容灾方案稳定性高、对服务器性能基本无影响,是容灾方案的主流选择。
本文链接: