在现代数字化世界中,企业依赖于技术保持其业务连续性。当意外事件发生时,如自然灾害、硬件故障或网络中断,传统的基础设施可能会变得脆弱不堪。云计算通过提供弹性资源,为企业提供了一种应对这些挑战的解决方案。
什么是云资源弹性?
云资源弹性是指云计算环境中资源的适应能力和恢复能力。它允许企业在故障发生时快速地重新配置和重新分配资源,以确保业务服务继续运行
最佳实践
为了最大限度地发挥云资源弹性的优势,企业应遵循以下最佳实践:
- 制定清晰的灾难恢复计划,概述故障发生时的响应步骤。
- 定期测试灾难恢复计划以确保其有效性。
- 使用云服务提供商的冗余和灾难恢复服务,如负载均衡和灾难恢复。
- 与云服务提供商合作开发定制化的弹性策略,以满足特定的业务需求。
结论
云资源弹性对于在故障发生时保持业务连续性至关重要。通过提供适应能力和恢复能力,云计算帮助企业最大限度地减少业务中断,提高数据安全性,降低成本并提高可扩展性。通过遵循这些最佳实践,企业可以利用云资源弹性来增强其业务弹性,确保在即使面临挑战的时候也能持续运营。
解析云原生 2.0 架构设计的 8 大关键趋势
云原生2.0是企业智能升级新阶段,企业的云化从“ON Cloud”走向“IN Cloud”,当一切应用都生于云,长于云,云架构的迭代也会进入一个新的阶段。
围绕云原生2.0,华为云首席架构师顾炯炯提出了8个关键模式: 分布式云,混合调度,应用驱动基础设施,存算分离与数据治理自动化,可信、平民化DevOps,基于软总线的异构集成,多模态可迭代AI模型,全方位立体式云安全。
分布式云
随着云化和数字化渗透到制造类、工业互联网类场景,5G技术在to B领域应用的快速成熟,以及物联网 、AI技术的成熟,现在云的服务对象不仅是企业的后台IT支撑系统,它延伸到了前端的“现场”,类似于工业场景里的近场计算。
如果还是将所有的数字化应用系统都放在集中的数据中心,它的时延无法满足实时生产系统的要求。
另外,有一些行业的敏感数据不能从现场或者数据产生地直接简单的上传到云端,它存在数据安全、隐私保密的问题。
再比如医疗里的基因大数据、视频监控等场景,如果所有数据都上传到云端,带宽的成本非常高昂。
所以,我们必须要引入云边端协同的分布式概念,构建分布式云的架构。
这个架构可以和核心侧架构配合,覆盖核心区域、热点区域、本地机房、业务现场等不同接入时延敏感度,数据隐私合规要求及数据上云带宽成本的应用上云场景。
举个例子,通过这样的方式,可以把云端的很多算力和计算逻辑,甚至是训练好的AI模型推送到更加靠近用户数据产生地的位置上,进行就近的计算,将海量的数据做一定的收敛、分析、脱敏等,再发送到云端进行闭环的处理和控制反馈。
混合调度
在很多算法专家的努力下,华为云通过瑶光调度平台大大提高了资源的分配效率,达到甚至超过了80~90%的程度,已经接近于业界的领先水平。
但是资源的实际利用率仍然处在一个比较低的水平,当然业界平均也不是特别理想,领先者差不多20%左右。
为了解决这样的问题,华为云引入混合调动、柔性计算的能力,将在线和离线的不同优先级的业务,进行QoS感知的智能调用,实现资源利用率最大化。
柔性计算不仅仅具备弹性的特征,保证了横向的资源扩展,而且它也能实现纵向资源规格的可大可小。
目前,消费者云已经在内部验证了柔性计算的能力,可以在不改变上层业务的前提下提高利用率,实现性能的倍增。
关于柔性计算的更多内容参考 华为云首席架构师顾炯炯:敢为人先,探索架构创新之路如何走。
应用驱动的基础设施
如今,软硬件的垂直整合,特别是靠近操作系统底层的硬件和云服务基础设施层的服务软件之间的纵向整合能力,成为新的趋势,它把基础设施服务底层的硬件和相应的服务封装层打包在一起。
云服务厂商可以设计研发定制芯片,比如存储和网络的硬件卸载的芯片、匹配深度学习逻辑处理框架的芯片等等。
如果有能力构建这样的软硬件垂直整合的能力,就能拥有相比其他云服务商更优的价格优势,也得以呈现自身独特的硬件、芯片优势。
有了应用驱动的基础设施之后,根据应用的性能SLA需求,来定义是使用与软件完全解耦的通用硬件资源,还是匹配应用场景特殊诉求的软硬件深度协同的卸载卡或异构计算资源。
这也能发挥华为软硬件兼长的优势,我们在硬件领域有不少核心创新:一个是 SDI, 叫软件驱动的基础设施,也就是把分布式存储\分布式网络,还有Hypervisor的一些系统能力从服务器卸载到PCI卡上,也即SDI/擎天卸载卡。
二是鲲鹏硬件支撑云存储和数据湖的处理, 鲲鹏单核处理能力虽弱于X86,但核密度则达到X86 CPU的2倍,因此在对IO及内存带宽作为其性能瓶颈的大数据及分布式存储场景,是比X86更好的选择。
同时,我们也在用自研的升腾NPU取代GPU构建AI平台, 它在深度学习的训练推理中体现出更高的能效比。
存算分离和数据治理的自动化
未来企业的所有的数据孤岛都将汇聚到云端的数据湖,进行统一生命周期的治理和管理,所以必须要解决数据计算分析的资源需求。
数据湖里有各种各样的结构化、半结构化、非结构化的数据,但这些数据的分析计算和底层的存储容量之间的需求,并不是线性匹配的关系。
比如对于深度学习的场景,数据量需要不断的计算迭代,它需要更多的计算能力,相对较少的存储需求。
因此在不同的业务场景下,数据分析计算和存储的要求是不一样的,最终一定要走向存算分离。
在存算分离领域里面,华为云已经积累优势,从最早的去中心化的分布式存储引擎FusionStorage开始,七年磨一剑,我们从内部验证到向外部的推广,从块存储延伸到对象存储、文件存储、分布式的集群数据库,把原先在开源架构里五花八门的底层存储技术引擎架构实现了统一。
经过实际的测试,在业界同样支持存算分离数据湖架构的云场景中,华为云体现了领先30-60%以上性能优势。
再就是数据治理自动化。
现在的数据治理的还是人力密集型工作,整个过程非常低效,很难满足很多行业的要求。
所以在这个架构模式里面,除了存算分离的数据库,还要构建数据治理自动化。
通过引入AI的技术,将数据的获取、清洗以及最终数据知识的提取,主题库的建立、数据目录的发布,都实现完全的自动化。
用户只需要指定入湖的数据源和所属业务主题域,系统自动化创建入湖任务,底层资源根据入湖数据量自动扩缩容,智能完成入湖数据的安全等级、分级分类、隐私等级等数据标签的自动识别打标。
这个能力对企业数据资产的快速沉淀能力的构建是至关重要的。
可信、平民化DevOps
通过将一系列安全可信措施嵌入到敏捷开发运维模式, 构建所谓的DevSecOps流水线,实现敏捷快速迭代与严格质量管控兼顾;并通过低代码/无代码实现更多行业应用资产的沉淀, 将行业应用的开发效率再上一个新台阶。
Devops实现了应用的敏捷开发,但在面向政企时,还需要满足应用质量和安全可信的要求。
因此在遵循DevOps的同时,将安全能力集成到其中,升级成为DevSecOps。
使用安全左移、默认安全、运行时安全、安全服务自动化/自助化、基础设施即代码(IaC)等技术, 实现管理与协同、设计与开发、CI/CD、应用管理、运维、安全可信等各个环节的一体化趋势。
此外,由于传统政企开发投入有限,需要通过低码化无码化,来实现对应用进行快速构建及改造。
华为云低代码平台AppCube可支持多种页面类型和丰富的组件能力,基于它的服务能力编排和业务流程无代码定制,可实现灵活流程触发方式、多种权限配置方式、自定义业务编排等。
基于软件总线的异构集成
即帮助企业构建可平滑演进的IT架构, 实现老旧应用与新建云原生应用,线上与线下应用的平滑融合集成。
云原生下,企业很多应用都要进行微服务解耦,遵从微服务的治理架构,进行水平扩展的架构的设计,甚至把原来的单体架构逐步进行拆解。
但这个过程不是一蹴而就的,尤其是那些包袱比较重的传统行业,他们还面临很多现实的挑战。
所以我们要在企业传统IT架构和云原生架构之间搭建无缝的桥梁,在确保企业业务连续性最大化的前提下,实现平滑的切换和演进。
以Roma Connect为例,它可以通过软总线的形式,把云原生和非云原生的传统世界无缝的连接起来,支持异构的应用和数据库源的对接,也可以对接到云上开发平台、数据湖,实现无缝互通。
在架构的平滑演进中,首先需要将传统非云原生应用封装为REST接口与云原生应用对接,通过统一接口服务层APIC进行开放,业务云原生应用通过标准接口即可获取老系统信息。
同样的机制可以将线上线下,及部署在多云环境上企业IT系统的无缝互通。
其次传统Oracle/Sybase等传统数据库及中间件与设备协议接入上云:云上云原生应用通过云上标准API调用、数据库访问、消息订阅等方式即可获取传统数据。
最后,通过全生命周期的API管理能力,包含从设计、发布、上架、治理的全过程,帮助企业构建整个跨地域,跨组织、跨部门的应用网络,并沉淀行业应用资产。
多模态可迭代的AI模型
AI在行业落地面临的问题是能够获取到的训练数据是非常有限的,单纯的依赖数据驱动的深度学习训练,使得行业AI模型是非常难以泛化、通用化。
预训练大模型是解决AI应用开发定制化和碎片化的重要方法。
通过一个AI大模型实现在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,赋能AI开发由作坊式转变为工业化开发,比如华为云之前推出的盘古大模型。
另外也要引入知识计算的能力, 类似于把知识图谱这样的能力和基于感知计算的数据驱动的AI模型互补结合起来。
也就是说把知识模型和数据模型,在数据样本相对缺少的情况下结合在一起,更好服务于行业AI的落地。
帮助企业打造自己的知识计算平台,整合分散在不同系统、多种形态的企业数据,形成带有建议性的知识体系。
全方位的立体式云安全
1.0阶段的云安全服务更多的是孤立的安全能力:虚拟化安全,hyporvisor防逃逸能力,云防火墙能力其实都是割裂的,并没有跟所有的云服务形成互锁。
全方位的立体式运营安全通过打通离散的云安全服务能力,将其与其他云服务及客户应用形式互锁, 构建安全Build-in的云原生应用,以及引入可信智能计算,解决跨行业数据隐私保护与流通碰撞、价值挖掘之间的矛盾。
首先通过可信智能计算提供四个核心能力,进行安全可信的数据计算。包括:
1、跨组织、跨行业的多方数据融合分析和多方横向与纵向联邦学习建模;
2、支持对接主流数据源和深度学习框架;
3、支持安全多方计算(例如同态加密,差分隐私等),并支持用户自定义隐私策略;
4、基于区块链的数据计算轨迹的可追溯可审计。
此外,为了全方位安全,还需要将全栈云(及其子集)下沉部署(连线/非连线),彻底解决敏感行业上云安全顾虑,以及将全栈云服务、企业新开发云原生应用、aPaaS/SaaS等与全栈云安全能力互锁,为用户构建体系化的云安全平台。
本文分享自华为云社区,作者:技术火炬手。
华为云DDoS防护,您身边的高防服务专家
近年来,DDoS攻击频率和复杂度逐年倍增,已无可争议地成为当前网络安全最大威胁之一。
一旦平台遭遇黑客攻击,很可能面临数据泄露、巨额勒索等风险。
当遭遇网络流量突增,设备CPU内存占用率莫名超高,导致业务断联、掉线、卡顿;业务大促、新业务上线却遭遇大量未知访问,导致合法用户无法登陆或者用户流失。
那么,大概率被DDoS攻击了。
DDoS堪称网络攻击界的“板砖”,信手拈来、简单有效,攻击成本远低于防御成本。
DDoS又名分布式拒绝服务攻击,顾名思义,通过分布在网络中的多台机器作为攻击平台,对目标服务器性能或网络带宽发起攻击,从而使得对方业务暂时中断或停止。
目的是破坏正常的业务经营(恶意竞争),给被攻击者带来经济损失,或者由此进行威胁勒索。
游戏、电商、金融、政府、互联网、大企业等都是被DDoS攻击的主要目标。
常见的DDoS攻击有哪些?网络层攻击比较典型的攻击类型是UDP反射攻击,例如NTP Flood攻击。
这类攻击主要利用大流量拥塞被攻击者的网络带宽,导致被攻击者的业务无法正常响应客户访问。
传输层攻击比较典型的攻击类型包括SYN Flood攻击、连接数攻击等。
这类攻击通过占用服务器的连接池资源从而达到拒绝服务的目的。
会话层攻击比较典型的攻击类型是SSL连接攻击。
这类攻击占用服务器的SSL会话资源从而达到拒绝服务的目的。
应用层攻击比较典型的攻击类型包括DNS flood攻击、HTTP flood攻击(即CC攻击)、游戏假人攻击等。
这类攻击占用服务器的应用处理资源,消耗服务器计算资源,从而达到拒绝服务的目的。
针对不同层面的攻击,目前市面上主流的防护手段主要有黑洞引流、带宽扩容和优化防护策略。
华为云结合10多年安全攻防经验及优秀实践,推出了抗DDoS攻击类防护服务,可以快速有效地应对各类DDoS攻击,保护您的业务连续性!华为云DDoS防护五大利器,助您轻松应对DDoS攻击弹性带宽,遇敌则强卓越性能:原生防护CNAD提供TB级防护能力,支持同账号下防护能力共享;高防机房可提供10T以上全球总体防御能力,确保重要业务不被攻击中断。
AI智能防护,千人千面基于AI算法,支持100+种攻击类型防护,全面识别加密流量,有效抵御各类DDoS攻击和应用层CC攻击。
因地制宜,协同联防可搭配ECS、DNS、EIP、WAF等产品一起使用,漏洞型、大流量攻击一起防,提升云服务的安全防护能力。
流量自动调度DDoS原生防护IP联动高防服务资源,自动切换攻击流量到高防IP服务上,秒级自动切换攻击流量到对应的高防IP服务上,有效缓解云原生防护压力。
专业服务7*24小时专业运营团队,从缓解助手服务到重保提供不同层次的安全服务。
DDoS防护平台不少,但为什么要选择华为云?除已在华为商城、华为应用市场等业务中经受全球使用考验外,华为云DDoS防护还在全球拥有20+个清洗中心,支持T级流量的近源清洗。
该防护系统能即时检测网络和攻击流量,发现攻击后秒级启动响应,避免攻击引起的业务抖动,时刻为目标系统安全保驾护航。
系统还采用全自动检测和攻击策略匹配,采用电信级架构,网络安全专用CPU,可在大流量攻击时不抖动、不丢包、不延时,不影响业务转发。
防护功能如此强大,性价比也同样很高。
10G保底的低购入门槛,域名及ip均可防护,支持多个包周期购买,贴心地为用户提供针对性产品服务。
基础带宽+弹性带宽的购买方式,更让防护阈值支持弹性调整升级,用户可灵活选择最高可T级防护带宽。
同时,提供的7*24小时的专业运营团队支撑,及时响应用户不同层次的安全需求。
一句话总结,对于DDoS攻击,用户网站上云后,无需调整网站基础架构,一键即可添加防护,透明接入,秒级响应,轻松抵御大流量攻击!
云计算工程师需要具备哪些技能
云计算工程师的技能与知识基础涵盖多个层面,其中包括计算机和网络的基本知识,深入理解计算机与网络运作原理和技术。
这要求工程师具备扎实的理论基础,能够掌握网络架构、协议以及数据传输等方面的关键概念。
在技术架构方面,云计算工程师需要全面掌握各种云服务模型,包括IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务),以及云部署模式,如公有云、私有云和混合云。
通过理解这些模型,工程师能够针对不同业务需求,选择或设计合适的云服务方案。
虚拟化与容器技术是云计算环境中不可或缺的部分,它们极大地提升了资源的利用效率和灵活性。
工程师需要熟练掌握如VMware、KVM、Docker等虚拟化与容器技术,以实现高效、弹性、安全的云环境构建。
云安全技术与策略对于保护云上资产至关重要。
工程师需了解并应用身份认证、访问控制、数据加密、网络安全等技术,构建多层次、全方位的安全防护体系,确保数据安全和业务连续性。
编程与脚本语言是云计算工程师的必备技能。
掌握Python、Java、Shell等语言,能够提高自动化运维、服务部署与管理的效率。
这些技能在云环境的自动化、任务调度、故障诊断等方面发挥着关键作用。
综上所述,云计算工程师需要具备跨学科的知识与技能,包括计算机网络、云服务、虚拟化、安全、编程等多个领域。
持续的学习与实践是提升个人能力、适应云计算快速发展的关键。
通过不断探索与实践,云计算工程师能够为业务提供更加高效、安全、灵活的云解决方案。