随着云计算的兴起,云服务器架构也在不断演变,从传统的单体式架构演变到如今的模块化架构。本文将介绍云服务器架构的演变历程,并探讨模块化架构的优势。
传统云服务器架构
传统的云服务器架构通常采用单体式设计,即所有组件都打包在一个单一的虚拟机中。这种架构具有以下特点:
- 易于部署和管理:由于所有组件都在同一台虚拟机上,因此部署和管理相对简单。
- 成本低廉:单体式架构不需要额外的组件或管理工具,因此成本较低。
- 可扩展性差:当业务量增加时,单体式架构很难扩展,需要对整个虚拟机进行升级。
- 容错性差:如果其中一个组件出现故障,整个服务器都会受到影响。
模块化云服务器架构
模块化云服务器架构
数据中心服务器技术发展趋势与应用
当前,为推进IT支撑系统集约化建设和运营,进一步发挥集中化能力优势,IT云成为运营商IT支撑系统建设的基础架构。
但在IT云资源池部署过程中,服务器技术面临多个新挑战,主要体现在以下3个方面。
在性能方面,人工智能(AI)应用快速扩张,要求IT云采用高性能GPU服务器。
AI已在电信业网络覆盖优化、批量投诉定界、异常检测/诊断、业务识别、用户定位等场景规模化应用。
AI应用需求的大量出现,要求数据中心部署的服务器具有更好的计算效能、吞吐能力和延迟性能,以传统通用x86服务器为核心的计算平台显得力不从心,GPU服务器因此登上运营商IT建设的历史舞台。
在效率成本方面,IT云部署通用服务器存在弊端,催生定制化整机柜服务器应用需求。
在IT云建设过程中,由于业务需求增长快速,IT云资源池扩容压力较大,云资源池中的服务器数量快速递增,上线效率亟需提高。
同时,传统通用服务器部署模式周期长、部署密度低的劣势,给数据中心空间、电力、建设成本和高效维护管理都带来了较大的挑战。
整机柜服务器成为IT云建设的另一可选方案。
在节能方面,AI等高密度应用场景的快速发展,驱动液冷服务器成为热点。
随着AI高密度业务应用的发展,未来数据中心服务器功率将从3kW~5kW向20kW甚至100kW以上规模发展,传统的风冷式服务器制冷系统解决方案已经无法满足制冷需求,液冷服务器成为AI应用场景下的有效解决方案。
GPU服务器技术发展态势及在电信业的应用
GPU服务器技术发展态势
GPU服务器是单指令、多数据处理架构,通过与CPU协同进行工作。
从CPU和GPU之间的互联架构进行划分,GPU服务器又可分为基于传统PCIe架构的GPU服务器和基于NVLink架构的GPU服务器两类。
GPU服务器具有通用性强、生态系统完善的显著优势,因此牢牢占据了AI基础架构市场的主导地位,国内外主流厂商均推出不同规格的GPU服务器。
GPU服务器在运营商IT云建设中的应用
当前,电信业开始推动GPU服务器在IT云资源池中的应用,省公司现网中已经部署了部分GPU服务器。
同时,考虑到GPU成本较高,集团公司层面通过建设统一AI平台,集中化部署一批GPU服务器,形成AI资源优化配置。
从技术选型来看,目前运营商IT云资源池采用英伟达、英特尔等厂商相关产品居多。
GPU服务器在IT云应用中取得了良好的效果。
在现网部署的GPU服务器中,与训练和推理相关的深度学习应用占主要部分,占比超过70%,支撑的业务包括网络覆盖智能优化、用户智能定位、智能营销、智能稽核等,这些智能应用减少了人工投入成本,提升了工作效率。
以智能稽核为例,以往无纸化业务单据的人工稽核平均耗时约48秒/单,而AI稽核平均耗时仅约5秒/单,稽核效率提升达 90%。
同时,无纸化业务单据人工稽核成本约1.5元/单,采用GPU进行AI稽核成本约0.048元/单,稽核成本降低达96.8%。
整机柜服务器发展态势及在电信业的应用
整机柜服务器技术发展态势
整机柜服务器是按照模块化设计思路打造的服务器解决方案,系统架构由机柜、网络、供电、服务器节点、集中散热、集中管理6个子系统组成,是对数据中心服务器设计技术的一次根本性变革。
整机柜服务器将供电单元、散热单元池化,通过节约空间来提高部署密度,其部署密度通常可以翻倍。
集中供电和散热的设计,使整机柜服务器仅需配置传统机柜式服务器10%的电源数量就可满足供电需要,电源效率可以提升10%以上,且单台服务器的能耗可降低5%。
整机柜服务器在运营商IT云建设中的应用
国内运营商在IT云建设中已经推进了整机柜服务器部署,经过实际应用检验,在如下方面优势明显。
一是工厂预制,交付工时大幅缩短。
传统服务器交付效率低,采用整机柜服务器将原来在数据中心现场进行的服务器拆包、上架、布线等工作转移到工厂完成,部署的颗粒度从1台上升到几十台,交付效率大大提升。
以一次性交付1500台服务器为例,交付工作量可减少170~210人天,按每天配10人计算,现场交付时间可节省约17~21天。
二是资源池化带来部件数量降低,故障率大幅下降。
整机柜服务器通过将供电、制冷等部件资源池化,大幅减少了部件数量,带来故障率的大幅降低。
图1比较了32节点整机柜服务器与传统1U、2U服务器机型各自的电源部件数量及在一年内的月度故障率情况。
由于32节点整机柜服务器含10个电源部件,而32台1U通用服务器的电源部件为64个,相较而言,整机柜电源部件数减少84.4%。
由于电源部件数量的降低,32节点整机柜服务器相对于32台1U通用服务器的月度故障率也大幅缩减。
三是运维效率提升60%以上。
整机柜服务器在工厂预制机柜布线,网络线缆在工厂经过预处理,线缆长度精确匹配,理线简洁,接线方式统一规范,配合运维标签,在运维中可以更方便简洁地对节点实施维护操作,有效降低运维误操作,提升运维效率60%以上,并大幅减少发生故障后的故障恢复时间。
液冷服务器技术发展态势及在电信业的应用
液冷服务器技术发展态势
液冷服务器技术也称为服务器芯片液体冷却技术,采用特种或经特殊处理的液体,直接或近距离间接换热冷却芯片或者IT整体设备,具体包括冷板式冷却、浸没式冷却和喷淋式冷却3种形态。
液冷服务器可以针对CPU热岛精确定点冷却,精确控制制冷分配,能真正将高密度部署带到前所未有的更高层级(例如20kW~100kW高密度数据中心),是数据中心节能技术的发展方向之一,3种液冷技术对比如表1所示。
液冷服务器在运营商IT建设中的应用
液冷服务器技术目前在我国仍处于应用初期,产业链尚不完备、设备采购成本偏高、采购渠道少、电子元器件的兼容性低、液冷服务器专用冷却液成本高等问题是液冷服务器尚未大规模推广的重要原因。
从液冷服务器在运营商数据中心领域的具体应用案例来看,运营商在IT云资源池规划和建设过程中,通常会对液冷服务器的发展现状、技术成熟度等进行分析论证。
考虑到目前液冷服务器规模化应用尚处于起步阶段,需要3~5年的引入期,因此暂时未在IT云资源池建设中进行大规模落地部署,但在部分地区有小规模应用,如中国移动南方基地数据中心已经开展液冷服务器试点应用,中国联通研究院也在开展边缘数据中心服务器喷淋式液冷系统的开发。
未来,随着IT云建设规模、建设密度的继续攀升,以及液冷产业生态体系的逐步成熟,液冷服务器在IT云建设中将有更大的应用空间。
总体来看,运营商IT云资源池建设对服务器计算性能、延迟、吞吐、制冷、定制化、分布式部署等方面都提出了更高要求。
未来,GPU服务器、定制化整机柜服务器、液冷服务器等新兴服务器技术将快速迭代,为运营商数据中心服务器技术的发展和演进带来新的思路和路径。
3G→4G→5G:一张图看懂核心网演进史
3G与4G之间的核心网演进,从3GPP标准的诞生,到4G首版标准Release 8的发布,核心网经历了从电路交换到分组交换的转变。
Release 8引入了EPC(Evolved Packet Core)架构,实现所有服务通过IP协议驱动,传统电路交换域被整合到核心网中。
MME(移动管理实体)整合了传统MSC和EIR的功能,负责移动宽带网络的鉴权、漫游和会话管理。
HSS(归宿用户服务器)承担了3G系统的HLR和AuC的职责,存储所有网络用户信息。
S-GW(服务网关)和PDN-GW(分组数据网网关)分别继承了SGSN和GGSN的部分功能,负责路由数据包和与外部网络连接。
此外,PCRF(策略与计费规则功能单元)作为业务数据流和IP承载资源的策略与计费控制决策点。
4G核心网的CUPS(CP与UP分离)架构的提出,旨在支持不断增长的数据流量和核心网的模块化与可扩展性。
在CUPS架构下,PDN-GW分离为PGW-C和PGW-U,S-GW分离为SGW-C和SGW-U,TDF(流量检测功能)也分拆为TDF-C和TDF-U。
这使得控制面和用户面可以独立扩展,为更灵活的数据处理提供了支持。
进入5G时代,核心网经历了一次更深刻的变革。
NFV(网络功能虚拟化)和SDN(软件定义网络)技术的不断发展,推动了核心网架构的进一步优化。
5G核心网的核心变化体现在两个方面:一是支持全虚拟化架构,将传统实体网元演变为软件化的网络功能;二是除了对4G核心网的演进,还引入了控制和操作网络切片的功能。
5G核心网的演进包括对传统MME、UDM(统一数据管理)、SMF(会话管理功能)、PCF(策略控制功能)等的分拆与整合。
AMF(接入和移动性管理功能)负责注册、连接和可达性管理以及接入认证与鉴权。
UDM和AUSF(统一用户服务功能)整合了传统HSS的职责,负责存储所有网络用户信息。
SMF负责会话管理,UPF(用户平面功能)整合了PGW-U、SGW-U和TDF-U的功能。
PCF(策略控制功能)提供4G PCRF实体中的策略和计费规则。
5G核心网还引入了网络切片支持,至少需要包含AMF、SMF、PCF、AUSF、UDM和UPF等基本功能。
此外,为控制和操作每个网络切片,还提出了NEF(网络开放功能)、NSSF(网络切片选择功能)、UDSF(非结构化数据存储功能)、NWDAF(网络数据分析功能)、CHF(计费功能)、NRF(网络存储库功能)、UDR(统一数据存储库)、LMF(位置管理功能)等功能。
这些功能共同作用,为网络提供更高效、灵活的管理与服务。
成就智能汽车软件,昆易电子XIL工具链打造“中国名片”
随着软件定义汽车应用场景的落地,汽车从交通工具转向智能移动终端的趋势越发明显。
在软件定义汽车背景下,域导向和区域导向仍然是电子电气架构的两大主流方案。
相关数据预测,2025年-2030年,软件开发以及相关应用将为智能网联汽车产值带来巨大增量。
软件定义汽车时代,中国汽车软件测试的“痛点”与“对策”
在新技术、新体验的驱动下,汽车电子朝着智能网联的方向不断进化,汽车电子软件的开发工作量变得巨大且迭代速度越来越快,因此软件开发过程中的验证变得尤为重要。软件开发的增量势必带来测试需求的增加,庞大的测试量使得汽车软件测试面临一系列新课题:
第一,当前,汽车软件相关工作对国外工具链的依赖程度较高。
原因在于国内缺少相应工具链产品或者已有的工具链不完善;然而经过多年发展,国外已经具备完整的工具链。
第二,软件验证工具成本高昂。
这其中包括跨国采购货期长的时间成本;工具产品价格昂贵的购买成本以及软件年费高昂的维护成本。
第三,工具链商对国内技术支持弱。
当前大部分的工具链商属于国外厂商,关注更多的是欧美市场的软件开发需求。
然而,经过多年的发展,中国汽车软件技术在某些领域已取得领先地位,过程中诞生了的新技术。
这些技术在国外没有得到应用,也缺少对应的工具链支持验证。
面对“已有软件工具链”对国内汽车软件技术发展支撑不足的现状,在“软件定义汽车”概念提出之初,昆易电子科技(上海)有限公司(下称“昆易电子”)便开启了第二增长曲线,在“第二阶段”开发了一系列应用软件、HIL软硬件系统以及智能驾驶相关的测试工具。
昆易电子发展历程 | 图源:昆易电子
同时针对上述三个痛点,以昆易电子为代表的国内厂商也提交了自己的答卷。
在“2024第五届软件定义汽车论坛暨AUTOSAR中国日”上,昆易电子HIL事业部技术总监解振兴表示,昆易电子一直致力于攻克中国汽车软件测试工具链的发展瓶颈。
首先,昆易电子提出了覆盖汽车电子全域的产品,并提供完整的系统性解决方案。
其次,昆易电子全栈自研软硬件产品,尽可能有效降低测试工具链的成本。
最后,通过提供本土化技术咨询服务和深度定制化的产品开发,从而应对客户日益增长的软件产品需要。
在多年的发展中,昆易电子致力于嵌入式系统研发测试工具链的开发。
针对软件开发验证工作的痛点,昆易电子依托全栈自研能力和完备的研发团队开发了匹配V模型不同阶段的XIL工具链产品,助力智能汽车软件开发与验证。
基于“V”模型,昆易电子持续完善工具链产品生态
据解振兴介绍,基于“V”模型,昆易电子工具链产品基本形成了一个生态闭环,同时该生态闭环还在持续发展中。
“V”模型左侧是昆易电子在系统建模与分析、模型在环、快速原型控制器、产品级代码生成等自上而下的设计、验证产品与技术能力;“V”模型右侧覆盖部件级软件在环、硬件在环、车辆在环和道路测试等自下而上的测试、验证。
图源:昆易电子
在“V”模型右侧的不同阶段,即测试验证阶段,昆易电子提供不同的测试解决方案与之对应:
图源:昆易电子
从汽车功能域的角度,昆易电子HIL测试系统覆盖了动力底盘、三电新能源、智能网联、智能驾驶、智能车身、智能座舱等不同域的测试需求;同时面对不同域的多样化需要,昆易电子的HIL测试系统还具备四方面优势:
第一,模块化平台化,可以快速应对多样的定制化需求,支持第三方软件调用。
第二,兼容好覆盖广,可以兼容更多的测试开发环境,实现包含模型的闭环测试,也可完成仿真节点的开环测试。
第三,独立自主研发,昆易电子HIL测试系统拥有完全的自主知识产权。
第四,支持深度定制,技术的发展是日新月异的,产品的需求也在动态变迁,昆易电子HIL测试系统支持客户与时俱进的产品需求,共同探索新的领域。
针对汽车软件开发过程中的“数据驱动软件开发”概念,昆易电子打造了数据驱动软件开发的完整测试系统闭环。
纵向空间维度,实现了云端本地全链路覆盖。
云端有管理平台和数据平台;本地有完整的软硬件平台,其中软件平台(VCar System)为客户提供测试所需的所有软件,硬件平台涵盖板卡、数据记录仪和实时机等,提供整套可选择的模块。
软硬件系统相结合可以为整个被测系统提供测试验证。
云平台展示图 | 图源:昆易电子
昆易电子软件测试解决方案不仅实现了从云端到设备的全链路覆盖,也实现了从单控制器到整车系统范围的全覆盖。
同时,该系统还支持软件开发的全生命周期的验证和维护。
随着汽车电子电器架构趋向于区域导向,只实现纵向空间维度的数据传递与解决方案还远远不够,还需要不同的测试系统与之匹配。
因此,昆易电子提出了集群测试,真正实现了测试的横向拉通。
2024年,昆易电子还将推出新一版的总线仿真分析软件——VCAR DAS,助力更多汽车软件测试验证发展。
昆易电子 HIL测试系统
以极限性能,追求无限可能
“只有拥有极限性能,才能开启无限可能。”
VCAR DAS作为国产首款同时支持CAPL脚本与车载以太网通信协议的软件,不仅集成了仿真、诊断、数据库解析等多项功能,还实现了自动化测试,为汽车行业智能网联测试解决方案注入全新的可能性。
CAPL、Python自动化测试 | VCAR DAS软件
配合昆易电子硬件系统,VCAR DAS可做到更高的实时性——时间戳精度和时间同步精度均可做到1㎲,数据收发周期偏差做到50㎲。VCAR DAS测试系统的卓越性能主要得益于以下两点技术:
首先是昆易电子自主设计的硬件方案。
该硬件方案的优势在于可以保证总线性能和数量不受限制,具备优于单片机方案的硬件性能且可实现灵活配置。
通过简单配置即可实现故障注入,如位干扰等,同时可以将所有种类错误帧准确上传。
图源:昆易电子
其次是自研的实时机技术。
所谓“实时机”即在测试任务规定时间内,按照设定要求去执行,保证测试的确定性,保证测试结果的确定性和可重复性。
图源:昆易电子
因此昆易电子在系统层面对测试系统进行了优化设计——将上位机的软件运行在windows系统中,通过友好的UI界面与客户交互,将测试工程加载到实时机系统,借助实时机的实时性执行测试,保证测试结果的确定性。
未来,汽车通信领域会采用万兆乃至更高速率的通讯,windows系统的以太网性能很难达到汽车软件测试要求;而Linux系统在传统的网络服务器领域已经得到了充分地验证,是可靠的。
昆易电子认为,基于高带宽的网络测试和测试高实时性的要求,Linux实时机将成为网络测试发展的必由之路。
在这一方面,昆易电子已经做好了相关技术储备。
迎击多域融合新阶段,打造全域一站式解决方案
展望未来,汽车电子软件正迈向全面服务架构(SOA)与多域融合的新阶段,昆易电子也在紧跟行业步伐,深度洞察汽车电子软件的发展趋势,积极投身于高效测试产品的研发和优化工作。
结合全球汽车电子软件发展的需求,昆易电子不断选代创新测试产品,提供汽车电子软硬件在环的全域一站式解决方案。
整体而言,昆易电子SOA测试解决方案包含车端和云端两大内容。
在车端,上位机运行VCAR DAS软件,可以生成仿真节点,进行仿真节点的行为仿真和数据收发;再把编译好的程序代码加载到实时机,实时机将程序运行起来,调动板卡进行通信。
同时实时机会将测试的数据结果和相关报告上传到上位机,从而降低上位机运行的软件负载率。
在云端,基于 Python开发云端服务节点,在HIL环境下实现车云端SOA的联合测试。
图源:昆易电子
昆易电子的软件技术方案一般采用windows系统做相关的界面和数据分析,下位机运行测试程序。
这种技术特点也推动了相应的软件测试解决方案的研发,结合自有的软件开发工具,昆易电子SIL 测试解决方案针对“软件定义汽车”的需要,可以提供软件接口定义、输入输出量、标定量和测量量等,同时AUTOSAR标准输入输出接口实现可图形化配置。
目前,SIL测试解决方案在昆易电子内部已经完成软件单元测试和软件集成测试,并得到了应用。
其前提条件是软件单元需是完整的,软件集成后功能是完整的。
接下来,根据实际项目和开发节奏,昆易电子将推出SIL软件测试的工具产品。
昆易电子SIL 测试解决方案
当前,中国汽车软件行业在某些领域已经远超国外车厂,在软件工具链领域势必要打造出属于中国汽车的“中国名片”。
其中,以昆易电子为代表的国内厂商正致力于软件和软件工具链的测试开发,在软件定义汽车时代助力智能汽车的开发和验证。