云服务器集群的常见误区：识别和避免管理云服务器集群时常见的陷阱 (云服务器集群和普通服务器的区别)-优乐评测网

识别和避免管理云服务器集群时常见的陷阱

云服务器集群是云计算中一种重要的资源管理模式，它通过将多个服务器整合在一起，提供高可用性和可扩展性。在管理云服务器集群时，仍然存在一些常见的误区，如果不及时识别和避免，可能会对集群的性能和稳定性造成影响。

云服务器集群和普通服务器的区别

在讨论云服务器集群的常见误区之前，有必要了解云服务器集群与普通服务器 arasındaki差异。

资源共享：云服务器集群中的服务器共享资源，如计算、内存和存储，而普通服务器则是独立运行的。
高可用性：云服务器集群通过冗余和故障转移机制，确保即使单个服务器发生故障，集群也能继续运行，而普通服务器一旦发生故障，就会影响整个系统。
可扩展性：云服务器集群可以根据需求动态扩展或缩小，而普通服务器则需要手动添加或移除硬件来进行扩展。

云服务器集群的常见误区

1. 将所有服务运行在同一个集群上

误区：为了方便管理，将所有应用程序和服务都部署在一个云服务器集群上。

影响：不同的服务对资源的需求不同，将所有服务放在同一个集群上可能会导致资源争用、性能下降和稳定性问题。

建议：根据不同的服务类型和资源需求，将服务分组并部署在不同的集群上。

2. 忽略容错和高可用性

误区：认为云服务器集群天生就是高可用的，忽视容错和高可用性的设计。

影响：当单个服务器或组件发生故障时，集群的可用性和服务质量可能会受到影响。

建议：采用冗余、故障转移、负载均衡和自动恢复等机制，确保集群的高可用性和容错性。

3. 过度扩展集群

误区：为了追求高性能，过度扩展集群的规模，导致资源浪费和管理成本增加。

影响：过度扩展的集群可能导致资源争用、性能瓶颈和管理开销过高。

建议：根据实际负载和需求，合理规划集群的规模，避免过度扩展。

4. 忽略安全配置

误区：认为云服务商负责集群的安全，忽视对集群进行安全配置。

影响：未经适当配置的集群容易受到安全威胁，如未授权访问、数据泄露和恶意软件感染。

建议：遵循云服务商提供的最佳实践，加强集群的安全配置，包括防火墙、身份验证、入侵检测和日志监控。

5. 缺乏监控和告警

误区：认为集群可以自我管理，忽略建立监控和告警系统。

影响：缺乏监控和告警会延迟对集群问题的发现和响应，导致问题恶化和服务中断。

建议：建立完善的监控和告警系统，实时监测集群状态，及时发现和处理问题。

避免误区，提升集群管理效率

通过识别和避免这些常见的误区，企业可以提升云服务器集群的管理效率，确保集群的稳定运行和服务质量。以下建议也可以为集群管理提供帮助：使用专业的管理工具：使用云服务商提供的管理工具，可以简化集群的配置、监控和维护。自动化任务：通过脚本和自动化工具，可以自动化集群管理中的重复性任务，提高效率和减少错误。定期更新和维护：定期更新集群软件和补丁，确保集群的安全性和性能。寻求专业支持：如有必要，可以考虑寻求云服务商或专业服务提供商的支持，获得专家指导和技术帮助。遵循这些建议，企业可以避免云服务器集群管理中的常见误区，提升集群的性能、稳定性和安全性，充分发挥云计算的优势。

云渲染一定比本地渲染快？云渲染常见误区系列（一）

有些用户认为，云渲染必然比本地渲染更快，这可能源于对云渲染功能的误解。

事实并非如此，云渲染的速度取决于多种因素。

首先，对于场景简单、不复杂的项目，本地渲染通常能在几分钟到十几分钟内完成，而云渲染则需要经过打包、上传、解压和场景初始化等步骤，这时本地渲染可能更快。

其次，虽然云服务器在核心数、线程数和内存上具有优势，但处理器频率和性能可能不如用户的高端本地设备，对于中小型场景，配置高的本地设备在渲染速度上可能更具优势。

然而，在大型项目或场景复杂度高的情况下，云渲染的优势开始显现，能同时利用多台机器进行并行渲染，大大缩短渲染时间。

相比之下，本地渲染可能需要花费十几个甚至几十小时。

因此，云渲染在处理大规模任务时显得更为高效。

总结来说，云渲染与本地渲染各有优劣。

云渲染的优点在于其灵活的资源扩展，不占用本地资源，以及多任务并行处理。

而本地渲染的优势在于实时预览、文件传输速度更快，以及对成本的控制，特别是对于小型或预算有限的项目。

云渲染的优势包括：灵活的资源扩展适合复杂场景，不占用本地资源，以及支持多任务并行。

而本地渲染的优势在于实时反馈和更快的文件传输，以及成本更低，适用于对实时反馈有高要求或资源有限的项目。

云计算技术是什么意思？

云计算互联网技术的飞速发展，信息量与数据量快速增长，导致计算机的计算能力和数据的存储能力满足不了人们的需求.大大提高了成本费用。

在这种情况下，云计算应运而生。

云计算将待处理的数据送到互联网上的超级计算机集群中进行计算和处理，有效地降低应用计算的成本。

2008年2月，美国商业周刊发表了一篇题为(Google及其云智慧》的文章.开篇就宣称：“这项全新的远大战略旨在把强大得超乎想像的计算能力分布到众人手中。

”在此之后，云计算(CloudComputing)-跃成为ICT领域的耀眼明星，受到了产业界的广泛关注。

截止至2012年5月，由科技部批准的、已建成或正在建设的云计算中心，已有北京、无锡、深圳、长沙、天津、济南、青岛七处。

其中济南云计算中心：作为国内首家能够提供自主的云计算整体解决方案的厂商，近年来，浪潮为实现“中国云”建设的主动权，先后投入10多亿元，用于国家“863”重大专项32路高端容错服务器、PB级海量存储、云海OS操作系统等产品的研发，使得浪潮在核心云装备领域具备了与国际领先企业同等水平的产品和技术能力。

由此可见，全国各省市自治区将迈入建设云计算中心的趋势。

中国的“十二五”规划纲要明确指出要大力发展计算，加快云计算服务平台建设。

根据IDC发布的一份报告指出，未来电子政务建设面临的转变之一就是利用ICT技术实现与政务工作的深度融合。

这种转变预示着电子政务的发展模式正在发生本质性变化，即政府和社会一起共同创新公共服务，共同创新经济发展。

而这一转型的动力之一，就源于正在涌现的包括计算在内的新兴信息技术。

现在国内许多城市都在进行智慧城市的规划和建设，在青岛，从云计算平台和电子政务大一统的模式着手，为智慧城市的建设打下了基础。

以一卡通、一证通、政府邮箱、网上审批、政府在线等政府服务为基础，吸引各种社会服务资源，打造集电子政务、电子商务、社会服务于一体的网上“市民之家”和“企业之家”，形成了城市服务综合体系。

一、那么什么是云计算呢？云计算概念是由Google提出的，这是一个美丽的网络应用模式。

狭义云计算是指IT基础设施的交付和使用模式，指通过网络以按需、易扩展的方式获得所需的资源；广义云计算是指服务的交付和使用模式，指通过网络以按需、易扩展的方式获得所需的服务。

这种服务可以是IT和软件、互联网相关的，也可以是任意其他的服务，它具有超大规模、虚拟化、可靠安全等独特功效；云端的概念就是代表了互联网(Internet)，通过网络的计算能力，取代使用你原本安装在自己电脑上的软件，或者是取代原本你把资料存在自己硬盘的动作，你转而通过网络来进行各种工作，并存放档案资料在网络，也就是庞大的虚拟空间上。

我们通过所使用的网络服务，把资料存放在网络上的服务器中，并借由浏览器浏览这些服务的网页，使用上面的界面进行各种计算和工作。

二、云计算的应用云计算已经从概念期走向实践应用阶段。

其实在我们日常生活中已经不知觉的站在了云端上。

“说个简单的例子，只要我们轻轻摇一下手机，方圆500米范围内的空载出租车信息就会出现在手机屏幕上，包括车牌和司机电话”。

再如网络为基础的电子邮件服务像是Hotmail或Yahoo，可以说是云计算中最早的热门形式。

如果你使用Facebook来与朋友互动，使用Flickr来存放照片，或者是用GOogle Gmail来发送邮件，你已经是在云端环境中存放自己的资料，同时使用云端为基础的技术，也就是新闻说的幕后神奇魔法。

云端冲浪就像是不论你在哪边都看得到天空，你可以在任何能够使用网络访问的地方，连接你需要的云计算服务，即便你不是在自己的电脑上走进云端之中，上网本(netbook)的成功，以及移动网络(如可上网手机)的发迹，让云计算的普及性更高，人手一机是云计算很好的增长动力。

上网本与手机通常被定义成较低性能的计算设备，也因此他们消耗较少的电力，同时具备相当程度的便携性。

一台上网本也许不能把肥大的Photoshop软件跑得很顺，或者是不能存储超大量的音乐文档。

但感谢云计算之赐，上网本并不需要具备这些能力，它需要的只是一个浏览器，以及网络连接能力，这样就能够听大量的音乐，线上处理照片，或者是在云端上发送电子邮件给其他联络人。

所以，如果你需要的只是打一份文件，也许它同时需要包涵一些基本的格式处理，你并不需要微软Word软件的完整计算能力，你只需要上网登录Google Docs就可以做到类似的效果。

在云计算中，服务器并不会管你电脑的计算能量有多强。

有的同事在办公室用PC连上Google Docs，在家则是用Apple MacBook，同时还有很多其他的服务可以通过你的手机或iPhone与Android平台手机上的应用软件来完成。

多人协同操作的云计算：你可以在任何一台电脑上登入使用云端服务，而一个朋友或同事也可以登入并和你一起在一样的文件上工作。

Google Docs只是能够协同操作的一种办公室型态云计算服务。

有些服务甚至还可以让人在全球不同的地点登入服务并同时在一样的文件上工作。

简介云计算（Cloud Computing）是网格计算（Grid Computing）、分布式计算（Distributed Computing）、并行计算（Parallel Computing）、效用计算（Utility Computing）网络存储（Network Storage Technologies）、虚拟化（Virtualization）、负载均衡（Load Balance）等传统计算机技术和网络技术发展融合的产物。

它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统，并借助SaaS、PaaS、IaaS、MSP等先进的商业模式把这强大的计算能力分布到终端用户手中。

Cloud Computing的一个核心理念就是通过不断提高“云”的处理能力，进而减少用户终端的处理负担，最终使用户终端简化成一个单纯的输入输出设备，并能按需享受“云”的强大计算处理能力！云计算的核心思想，是将大量用网络连接的计算资源统一管理和调度，构成一个计算资源池向用户按需服务，这与我国著名云计算专家刘鹏教授早在2003年就提出的“网格计算池”是完全一致的。

定义狭义云计算指IT基础设施的交付和使用模式，指通过网络以按需、易扩展的方式获得所需资源；广义云计算指服务的交付和使用模式，指通过网络以按需、易扩展的方式获得所需服务。

这种服务可以是IT和软件、互联网相关，也可是其他服务。

云计算的核心思想，是将大量用网络连接的计算资源统一管理和调度，构成一个计算资源池向用户按需服务。

提供资源的网络被称为“云”。

“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。

云计算的产业三级分层：云软件、云平台、云设备。

提供资源的网络被称为“云”。

“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。

这种特性经常被称为像水电一样使用IT基础设施。

[1]广义云计算有人打了个比方：这就好比是从古老的单台发电机模式转向了电厂集中供电的模式。

它意味着计算能力也可以作为一种商品进行流通，就像煤气、水电一样，取用方便，费用低廉。

最大的不同在于，它是通过互联网进行传输的。

云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展，或者说是这些计算机科学概念的商业实现。

云计算是虚拟化(Virtualization)、效用计算(Utility Computing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演进并跃升的结果。

原理云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展，或者说是这些计算机科学概念的商业实现。

云计算的基本原理是，通过使计算分布在大量的分布式计算机上，而非本地计算机或远程服务器中，企业数据中心的运行将更与互联网相似。

这使得企业能够将资源切换到需要的应用上，根据需求访问计算机和存储系统。

这可是一种革命性的举措，打个比方，这就好比是从古老的单台发电机模式转向了电厂集中供电的模式。

它意味着计算能力也可以作为一种商品进行流通，就像煤气、水电一样，取用方便，费用低廉。

最大的不同在于，它是通过互联网进行传输的。

云计算的蓝图已经呼之欲出：在未来，只需要一台笔记本或者一个手机，就可以通过网络服务来实现我们需要的一切，甚至包括超级计算这样的任务。

从这个角度而言，最终用户才是云计算的真正拥有者。

云计算的应用包含这样的一种思想，把力量联合起来，给其中的每一个成员使用。

特点数据安全可靠首先，云计算提供了最可靠、最安全的数据存储中心，用户不用再担心数据丢失、病毒入侵等麻烦。

很多人觉得数据只有保存在自己看得见、摸得着的电脑里才最安全，其实不然。

你的电脑可能会因为自己不小心而被损坏，或者被病毒攻击，导致硬盘上的数据无法恢复，而有机会接触你的电脑的不法之徒则可能利用各种机会窃取你的数据。

此前轰动一时的“艳照门”事件据报道不也是因为电脑送修而造成个人数据外泄的吗？反之，当你的文档保存在类似 Google Docs 的网络服务上，当你把自己的照片上传到类似 Google Picasa Web 的网络相册里，你就再也不用担心数据的丢失或损坏。

因为在“云”的另一端，有全世界最专业的团队来帮你管理信息，有全世界最先进的数据中心来帮你保存数据。

同时，严格的权限管理策略可以帮助你放心地与你指定的人共享数据。

这样，你不用花钱就可以享受到最好、最安全的服务，甚至比在银行里存钱还方便。

客户端需求低其次，云计算对用户端的设备要求最低，使用起来也最方便。

大家都有过维护个人电脑上种类繁多的应用软件的经历。

为了使用某个最新的操作系统，或使用某个软件的最新版本，我们必须不断升级自己的电脑硬件。

为了打开朋友发来的某种格式的文档，我们不得不疯狂寻找并下载某个应用软件。

为了防止在下载时引入病毒，我们不得不反复安装杀毒和防火墙软件。

所有这些麻烦事加在一起，对于一个刚刚接触计算机，刚刚接触网络的新手来说不啻一场噩梦！如果你再也无法忍受这样的电脑使用体验，云计算也许是你的最好选择。

你只要有一台可以上网的电脑，有一个你喜欢的浏览器，你要做的就是在浏览器中键入 URL ，然后尽情享受云计算带给你的无限乐趣。

你可以在浏览器中直接编辑存储在“云”的另一端的文档，你可以随时与朋友分享信息，再也不用担心你的软件是否是最新版本，再也不用为软件或文档染上病毒而发愁。

因为在“云”的另一端，有专业的 IT 人员帮你维护硬件，帮你安装和升级软件，帮你防范病毒和各类网络攻击，帮你做你以前在个人电脑上所做的一切。

轻松共享数据此外，云计算可以轻松实现不同设备间的数据与应用共享。

大家不妨回想一下，你自己的联系人信息是如何保存的。

一个最常见的情形是，你的手机里存储了几百个联系人的电话号码，你的个人电脑或笔记本电脑里则存储了几百个电子邮件地址。

为了方便在出差时发邮件，你不得不在个人电脑和笔记本电脑之间定期同步联系人信息。

买了新的手机后，你不得不在旧手机和新手机之间同步电话号码。

对了，还有你的 PDA 以及你办公室里的电脑。

考虑到不同设备的数据同步方法种类繁多，操作复杂，要在这许多不同的设备之间保存和维护最新的一份联系人信息，你必须为此付出难以计数的时间和精力。

这时，你需要用云计算来让一切都变得更简单。

在云计算的网络应用模式中，数据只有一份，保存在“云”的另一端，你的所有电子设备只需要连接互联网，就可以同时访问和使用同一份数据。

仍然以联系人信息的管理为例，当你使用网络服务来管理所有联系人的信息后，你可以在任何地方用任何一台电脑找到某个朋友的电子邮件地址，可以在任何一部手机上直接拨通朋友的电话号码，也可以把某个联系人的电子名片快速分享给好几个朋友。

当然，这一切都是在严格的安全管理机制下进行的，只有对数据拥有访问权限的人，才可以使用或与他人分享这份数据。

可能无限多最后，云计算为我们使用网络提供了几乎无限多的可能为存储和管理数据提供了几乎无限多的空间，也为我们完成各类应用提供了几乎无限强大的计算能力。

想像一下，当你驾车出游的时候，只要用手机连入网络，就可以直接看到自己所在地区的卫星地图和实时的交通状况，可以快速查询自己预设的行车路线，可以请网络上的好友推荐附近最好的景区和餐馆，可以快速预订目的地的宾馆，还可以把自己刚刚拍摄的照片或视频剪辑分享给远方的亲友……离开了云计算，单单使用个人电脑或手机上的客户端应用，我们是无法享受这些便捷的。

个人电脑或其他电子设备不可能提供无限量的存储空间和计算能力，但在“云”的另一端，由数千台、数万台甚至更多服务器组成的庞大的集群却可以轻易地做到这一点。

个人和单个设备的能力是有限的，但云计算的潜力却几乎是无限的。

当你把最常用的数据和最重要的功能都放在“云”上时，我们相信，你对电脑、应用软件乃至网络的认识会有翻天覆地的变化，你的生活也会因此而改变。

互联网的精神实质是自由、平等和分享。

作为一种最能体现互联网精神的计算模型，云计算必将在不远的将来展示出强大的生命力，并将从多个方面改变我们的工作和生活。

无论是普通网络用户，还是企业员工，无论是IT管理者，还是软件开发人员，他们都能亲身体验到这种改变。

营销通过网络，把多个成本较低的计算实体，整合成一个具有强大营销能力的完美系统。

核心理念就是通过不断提高“云”的覆盖能力，以及“云”之间的逻辑计算能力，从而达到系统营销的结果，他可以减少用户的经济负担，最终使用户简化到只要在家里，一台终端，都可以得到近乎无限数量的优质客户，享受“营销云”带来的强大经济利益。

狭义云营销：帮客户销售产品，快速建立全国营销渠道，获取经济利益。

广义云营销：树立企业品牌形象，获取更大社会资源等公众认可的云计算的三个服务模式——IaaS、PaaS、SaaS1、IaaS(Infrastructure-as-a- Service)：基础设施即服务。

消费者通过Internet可以从完善的计算机基础设施获得服务。

目前，只有世纪互联集团旗下的云快线公司号称要开拓新的IT基础设施业务，但究其本质，它只能实现主机托管业务的延伸，很难与亚马逊等企业相媲美。

2、PaaS(Platform-as-a- Service)：平台即服务。

PaaS实际上是指将软件研发的平台作为一种服务，以SaaS的模式提交给用户。

因此，PaaS也是SaaS模式的一种应用。

但是，PaaS的出现可以加快SaaS的发展，尤其是加快SaaS应用的开发速度。

但是纵观国内市场，只有八百客一个孤独的舞者，拥有PaaS平台技术。

可见，PaaS还是存在一定的技术门槛，国内大多数公司还没有此技术实力。

3、SaaS(Software-as-a- Service)：软件即服务。

它是一种通过Internet提供软件的模式，用户无需购买软件，而是向提供商租用基于Web的软件，来管理企业经营活动。

相对于传统的软件，SaaS解决方案有明显的优势，包括较低的前期成本，便于维护，快速展开使用等。

比如红麦软件的舆情监测系统。

误区[2]厂商的炒作，加上IT人的自欺，很快就会让人们对某种技术感到失望。

如果你正在考虑云计算战略的话，请千万别被这些虚伪的承诺所迷惑。

如今，无论你去哪里，都会有人对你说，或者向你兜售和云计算有关的什么东东。

而你只有剥去其谎言的外衣，还其本来面目，你才能够了解云计算是否真的适合于你的企业。

下面就是我们列出的关于云计算的9大必须剥去的谎言。

谎言1：只有一种“云”。

至少有三种格式的“云”，每一种都有着不同的利益和风险。

它们是1)“基础设施作为服务”(IaaS，提供按需使用的虚拟服务器，例如Amazon的EC2)；2)Web服务或称“平台作为服务”(PaaS)，提供API或开发平台供客户在云中创建自己的应用；3)软件作为服务(SaaS)，例如Salesforce. com的CRM软件。

你正在运行哪类应用，生成何种数据，都会对你是否以及怎样采用云计算产生完全不同的结果。

谎言2：你需要的只是一张信用卡。

如果你是位孤独的开发者，有的是时间，那么从命令行上对虚拟服务器进行配置是没什么问题，但如果你掌管着一家企业，那么如何安装配置操作系统、多种应用、数据库连接才能产生回报？都是你必须要考虑的问题。

如果你的企业规模够大，那就还得制定安全、数据格式或数据质量等诸多的标准。

千万别信一些厂商所说的，“只要去厂商那里买一台开发服务器，过去IT部门需要3、4天才能配置好的工作如今15分钟就能搞掂。

”西门子IT解决方案与服务北美公司首席架构师Michael Kollar说，他的公司约有2500台服务器需要虚拟化，向企业内外部的使用者提供云服务，然而，云服务既不安全，也不适合公司的各种标准，无法集成到范围更广的IT环境中去。

很多IaaS厂商甚至无法适应企业的应用需求。

Sitemasher的创始人兼CTO Phil Calvin尝试着想找一家云服务商，去管理他现在自己管理的服务器。

结果呢？“我们找不到一家能够按需扩展我们的标准服务器的厂商”，他说。

既没有厂商能够提供他需要的低延迟性能，也没有厂商能提供跨数据中心的全球负载均衡。

谎言3：云计算可以减少工作量。

长期来看可能如此，但是开始的时候，你必须首先考虑哪种模式的云计算适合于你；哪些应用或服务适合于这种云；如何保障适当的安全、法规遵从和正常运行。

还要记住，监控任何一家厂商的服务性能也需要额外的时间。

“当你在运行生产性应用时，还有大量的问题需要考虑，比如冗余、可靠性、性能和延迟等，”RightScale的CTO兼创始人Thorsten von Eicken说。

在把应用向云中迁移之前，客户必须确保上述需求都能满足。

另外，并非所有应用都能适合云计算。

例如依靠服务器集群的应用就不太适合与他人分享计算资源的云环境，因为它们需要每一台服务器的配置不能随意变更，并且需要有专门的带宽等等。

谎言4：可以将私有云和公用云无缝集成。

一些云服务的布道者们为我们呈现了这样两个美好的世界：你既能拥有由内部数据中心提供的控制权，又能享受到由外部云所提供的低成本与灵活性，而各类应用、存储和服务器都可以按照你的需要随意地拖放使用。

然而，要实现这一点相当困难。

就目前来看，需要大量的跑腿工作，大量的手动重配置和大量的工程设计努力，才能将应用同时迁移到公用云和私有云中。

只有当客户在公用和私有云中运行相同的平台时，无缝集成才会比较容易实现。

西门子的Kollar说，关键是需要有一种安全基础架构，可以跨两种环境；需要有既安全又节约的方法可以跨两种云复制数据或访问数据。

谎言5：什么时候都不可能无缝集成公用云和私有云。

这同样是不对的。

其实已经有一些厂商正在提供无缝集成。

例如Kollar就预计将在12到18个月内，向其客户提供两种云的无缝集成。

RightScale的von Eiken推荐了同时适用于公用和私有云的一些标准化配置、数据模型和自动部署策略。

当技术、标准和处理流程都比较完善之时，构建一个可共享公用和私有资源的基础应该是可能的。

谎言6：云计算怎么都能节约成本。

而麦肯锡最近发布的一份引起诸多争议的白皮书宣称，只有在云中运行某些特殊平台，例如Linux时，才有可能节省成本。

Google对此表示了异议。

Google Apps的高级产品经理Rajen Sheth认为，麦肯锡的报告只考虑了高度冗余架构中低成本服务器带来的成本节约，这是不全面的。

他认为客户利用“相同的可扩展应用服务器和数据库”，而不必再购买、安装、维护、扩展自己的数据库和应用服务器，同样能节约成本。

对此，麦肯锡未给出回应。

也有用户指出，在现有的许可证和技术支持模式下，客户们在云中部署软件可能要比在企业内部部署软件，需要向软件厂商支付更高的费用。

谎言7：云厂商能够确保云安全。

即便云厂商拥有多项安全认证证书，也不能保证你的特定服务器、应用和网络是安全的。

以西门子为例，为了确保西门子的云环境是安全的，则需要“从外部”仔细考察IT系统，保证每一条可以想到的用户能够访问关键信息的路径都是安全的才行，Kollar说。

保障每一个平台都是安全的，虽然不算是什么了不得的挑战，但是要保障所有需要安全的技术能在一起协同工作，这才是一项巨大的挑战。

谎言8：只要运行虚拟机，就是在做云计算。

虚拟化是在多个物理设备之间创建逻辑服务器或逻辑存储，它只是云计算所需要的一部分要素而已。

但是，即便有了虚拟机也并不意味着就有了云计算。

要想充分获得虚拟化的好处，IT部门或云厂商还必须提供按需伸缩容量的能力，按需付费的定价机制，让用户能够很容易地根据其需要配置新的服务器和存储设备。

允许用户定购虚拟服务器(尤其是为某些特殊任务重新配置的服务器)来做某些工作，是云客户的一个关键性的省钱目标。

但要说只是因为你运行了例如VMware的Infrastructure 3，自我服务就会自动发生那却未必。

Kollar说，西门子就投入了“一大笔钱”用于研发虚拟服务器和相关服务的标准服务菜单，用户可以按需从其私有云中定购这些服务。

谎言9：云计算只和技术有关。

的确，是技术让云计算成为可能，但是实现成本节约与灵活性还需要有正确的处理流程。

虚拟化是云计算的基础，而当客户要在各种物理设备之间迁移数据和应用时，前者是非常动态、高度变化的。

在云中可以使用标准化流程来提高效率。

Kollar说，通过利用ITIL管理框架与虚拟化技术相互结合，西门子已经把IT管理的工作量减少了25%到35%。

关于云的真相：云并非外卖，也绝非无忧无虑计算的神奇乐土，而是一种需要深入了解，花大力气去正确管理的复杂资源。

这里绝没有什么神话可言。

企业在将业务迁移到云之前，应首先考虑下列5个问题：1、你的云服务商是如何定义“良好的客户服务”的？服务本身的先进性固然重要，但是你必须弄清楚具体的某个厂商认为哪种服务才是良好的服务，以及服务中都包含了什么，比如赔偿政策、技术援助等等。

2、你对云服务商的有形设施是否满意？尽职调查(due-diligence)的部分内容包括检查厂商的有形设施，注意与厂商大楼维护有关的事务，以及厂商的设备维护计划和大楼中员工的数量等。

3、你应该清楚会出现哪种类型的服务中断事故。

有时，厂商不得不关闭部分更新或升级设备，因为那些活动会严重妨碍你的云计算服务。

搞清楚厂商计划多长时间进行一次例行检修，以及它会向用户们提供什么样的预先通知。

4、云服务商发展的速度有多快？你必须知道你的厂商是否有能力在不影响服务水准的前提下接受更多的新用户。

5、云服务商准备了那些后续程序？一旦服务出现中断故障，重要的是它能多快地找出问题的根源。

标准作为公众，需要鉴别哪些是真云，哪些是假云。

为此，刘鹏教授提出判断是不是云计算的三条参考标准，供大家参考[3]：资源来自网络这是云计算的根本理念所在，即通过网络提供用户所需的计算力、存储空间、软件功能和信息服务等。

点个赞，再走

负载均衡进阶：SLB常见问题解决方法

摘要：在由云栖社区和阿里云网络团队联合主办的2017阿里云网络技术在线高峰论坛上，阿里云技术专家添毅分享了网络产品部根据客户和阿里云运维的反馈提炼出的几大最主要和最常见的在使用SLB产品中发生的问题，并为大家介绍了针对这些常见问题的相应处理方法。

想知道如何借助SLB构建高可用系统以及健康检查是如何实现的，本文不容错过！本文内容根据演讲嘉宾分享视频以及PPT整理而成。

本次的分享将会主要围绕以下5个部分基本概念回顾如何构建高可用系统选择性能共享型还是性能保障型实例为什么健康检查异常为什么负载不均衡一、基本概念回顾 SLB是什么 SLB是阿里云推出的一款云负载均衡服务，其主要针对于多台云服务器进行流量分发，能够将业务流量分发到由多台云服务器所组成的后端服务器池上去，以此来提升系统的处理能力。

负载均衡所解决的问题主要包括两点：第一点，SLB能够消除系统的单点故障，这是因为SLB的后面是由多台云服务器组成的服务器池，那么当其中某一台服务器出现故障的时候并不会影响整个系统的可服务性。

第二点，由于后端的云服务器能够横向地进行扩展，所以也具有为海量业务提供服务的能力。

那么，为什么要使用云上的负载均衡呢？这是因为云上负载均衡主要有这样的几个特点：高可靠、高性能、低成本、安全性、易用性。

SLB基本组件阿里云的SLB主要包括了三个基本组件，这里也进行简单地介绍。

第一个基本组件就是实例，每个实例都唯一地标识了云负载均衡器，并且每个实例都对应一个VIP，VIP唯一地标识了负载均衡实例，也是负载均衡对外提供服务的地址。

第二个组件是监听，监听是由VIP+端口号来唯一标识的，一个监听中包含用户定制的负载均衡策略和转发规则。

最后一个基本组件就是后端挂载的服务器，也就是云服务器ECS，负责处理真正的业务请求。

二、如何构建高可用系统多层次的高可用如下图所示，阿里云的负载均衡是从四个层面上去构建高可用的。

从底层往上层看，分别是应用级别的高可用、集群级别的高可用、可用区级别(AZ)的高可用以及地域级别(Region)的高可用。

应用级别的高可用主要是通过针对SLB后端的ECS实例的健康检查来实现的。

当SLB发现后端不健康的或者不能正常工作的ECS的时候，会将这些不健康的ECS从SLB的转发路径中剔除掉，保证业务流量能够转发到正常的工作服务器当中。

集群级别的高可用主要是通过集群中LVS机器间的session同步来保障任何一个用户的业务会话都能够在所有的LVS机器上是相互同步的，当其中某一台LVS出现故障时，可以由其他的LVS来接替出现故障的机器的工作。

同时，由于会话保持的存在，用户的业务是不会发生中断的。

对于可用区级别的高可用和地域级别的高可用，在本文的后面会进行更加详细的介绍。

细说可用区级别容灾这里详细地介绍一下可用区级别的容灾。

可用区级别容灾的设计初衷是在当一个可用区出现重大灾情的时候，比如整个可用区的机房发生了掉电、光缆出现了中断、整个可用区机房中所有的物理机都无法正常工作的时候，也就是整个可用区都宕掉了的情况下，能够由备可用区来继续提供服务，这就是可用区级别容灾的设计初衷。

可用区级别的容灾并不是说某一个可用区中的某一个实例或者是某几个实例出现了故障就会发生可用区的切换，实例自动从可用区A切换到可用区B，这是一个比较常见的误区。

而针对于这样的误区，阿里云也建议用户在构建可用区级别的高可用的时候采取以下两个步骤：首先，建议用户在SLB实例的后端尽可能地去挂载多个可用区的ECS实例。

SLB能够支持跨可用区地挂载ECS云服务器，这样可以避免某个可用区的ECS都出现故障的情况下，还有其他可用区的ECS能够接替工作，虽然跨可用区挂在ECS会存在大约2毫秒左右的延迟，但是却能够大大地提升服务的可用性。

第二步就是针对于一些特别重要的业务，建议在不同的可用区分别地去购买SLB的实例。

比如在可用区A和可用区B各自购买一个SLB实例，在此基础之上再使用全球负载均衡GSLB来进行实例间的调度。

跨地域容灾的实现跨地域容灾这一部分与上面介绍的可用区级别容灾的第二步非常相似，也是借助于GSLB产品实现的，GSLB即智能DNS实现了针对于后端的健康检查、路由调度的优化功能，能够实现在地域之间的负载均衡实例的调度。

关于这部分的更详细的内容请参考：全球负载均衡跨地域容灾解决方案(。

三、选择性能共享型还是性能保障型实例共享型vs保障型-WHY保障型在如今这个共享经济的时代，像滴滴打车这样的模式是非常火的。

但是即便是有了滴滴打车，但是还有人会去买车，这是因为会出现如下两个大家可能曾经都碰到过的场景：早晚高峰叫不到车？雨雪天气路边冻成狗？还大幅提价？假期想远离尘嚣，找个僻静旷野放空自我，叫个滴滴？也许有去，但保证无回！所以说共享和保障都是客户的需求。

出于对于类似需求的考虑，阿里云的负载均衡也推出了性能保障型实例。

以前所推出的SLB共享型实例是因为性能指标没有办法实现隔离，因为所有的共享型实例都处于同一个大共享资源池中，所以在高峰期的时候就会出现资源的争抢，这样就无法满足对于性能具有刚性需求的大客户的诉求。

除此之外，还有一些体量特别大的超级用户，他们对于性能的要求会是非常高的，但是由于共享型实例无法做到性能隔离，也支持不了大颗粒度的性能指标，所以也无法完成这样的工作。

因此，阿里云推出了性能保障型的负载均衡实例。

超强性能保障型实例的性能规格如上图所示，其并发连接数最大可以达到500万，每秒的新建链接数(CPS)可以达到50万，针对于七层负载均衡系统的QPS可以达到10万。

除此之外，性能保障型实例还具有以下的特点：超强HTTPS性能。

性能保障型实例针对于七层系统，特别是HTTPS的业务进行了优化，实现了高性能硬加解卡，并且能够实现使HTTPS的业务单实例可达10万QPS。

超大并发连接数。

性能保障型实例的单实例的并发连接数可达500万，所以其可承载物联网场景的下海量连接，可以支撑共享自行车、智能手表等存在特别大量长连接的场景。

共享型实例平滑升级。

原有的共享型实例可以平滑升级至性能保障型实例，而无需更换VIP。

完善的业务监控系统。

在推出性能保障型实例之后，因为每个实例都有相应的性能规格和性能指标，所以阿里云也为用户提供了完整的业务指标监控系统，并支持电话、短信、钉钉企业群等方式的告警。

性能规格上图所展现的是阿里云SLB性能保障型实例的规格参数。

图中的最后两行规格7、8默认在控制台上是无法购买的，目前只针对企业级用户，而且需通过客户经理申请后，通过白名单开放。

如何选择规格对于保障型实例而言，主要有如下几个性能指标：最大连接数：一个实例可承载的最大连接数。

新建连接数：CPS表示一个实例每秒可以新建的链接数。

每秒查询数：QPS表示一个实例7层的像HTTP或者HTTPS系统的吞吐量。

通常一个4层SLB的性能好坏由最大连接数和新建连接数来衡量，它们表示了一个SLB系统的并发能力和处理突发连接的能力。

通常一个7层SLB的性能好坏主要由QPS决定，QPS表示了一个7层系统的吞吐量。

这里需要注意的是QPS是7层独有概念。

虽然每个规格都定义了三个性能指标，但是这并不代表这三个性能指标在任何一个性能场景下或者任何一个时刻都能够同时达到最大值，这里存在一个性能指标的短木板原则。

比如在某一个应用系统中，QPS已经达到指标上限，但最大连接数还远远没有达到上限，这时不论怎样加大客户端数量，最大连接数都会因为QPS达到上限，而无法达到最大值。

对于规格的选择而言，需要通过之前提到的业务监控系统来获取相关指标。

如果用户十分了解自己业务的相关指标，也就是对于高峰期的并发连接数会达到多少以及QPS会达到多少都有非常清晰的了解，也可以直接在控制台上选购。

但是如果用户并不清楚自己的相关业务指标，可以在初期选购按量付费的较高规格的实例，并且在一个业务周期内监控流量的峰值，在峰值确定好之后再通过变配的方式改变到比较合适的实例规格。

目前性能保障型实例还处于公测阶段，所以现在还没有对于实例收取规格费用，也就是说在这个阶段无论用户选择最小规格还是最大规格，实际上都只需要花费IP配置费和带宽费就可以了，这样也比较便于用户去熟悉和使用阿里云的性能保障型实例。

监控和告警前面也有所提及，在负载均衡的控制台上面能够直接地显示出相应的一些性能指标，但是在这里只能够实现对于性能指标的监控，却无法进行告警。

如果用户需要进行监控告警，可以在阿里云所提供的云监控控制台进行操作。

云监控平台可以监控阿里云中的所有产品并且实现业务告警的定制，并且可以选择包括短信邮件、电话、企业钉钉群等方式进行业务的实时告警。

四、为什么健康检查异常健康检查机制接下来分享在负载均衡的日常使用中出现的问题，特别是很多用户都存在疑问的健康检查部分的问题。

阿里云的负载均衡一共可以支持四种协议，四层的负载均衡系统主要包括了TCP、HTTP以及UDP协议，而七层的系统则包括了HTTP和HTTPS，而由于目前HTTP和HTTPS都是使用的普通的HTTP方式，所以其实也可以归结为三类协议。

对于TCP而言，健康检查的过程是通过发送ACK这种TCP的探测报文去探测端口是否仍然存活；对于HTTP而言，则主要使用的是HEAD的请求方式来检查目标的页面是否正常；UDP部分则主要借鉴了SMP协议的原理。

健康检查部分主要会涉及到几个指标，这些指标需要用户在控制台上进行设置，上图中给出了一些默认的建议值，比如响应的超时时间，也就是在每一次进行健康检查的时候，如果超过一定时间健康检查还没有回应就认为这次的健康检查是失败的；还有健康检查间隔，也就是两次健康检查之间通常需要间隔2秒钟；而所谓的不健康阀值和健康阀值就是在网络环境中往往会由于网络的抖动以及其他的因素导致偶尔的一次健康检查失败了，但是这时候并不能认为服务是真的失败了，所以需要设置一个阀值，比如3次就指的是当3次健康检查都失败的时候才会认为后端的服务是存在问题的，然后将其从转发路径中摘除掉。

同样的，当服务从不健康变为健康的时候，也需要进行连续的几次探测，当确定处于稳定的健康状态之后再将其加入到SLB的后端中去。

为啥会失败(TCP) TCP的健康检查也经常会出现一些失败的情况，这里也为大家提供了简单的故障排查顺序供参考。

当出现健康检查失败的时候，首先可以检查一下后端的服务器是否已经启动。

如果后端服务器的负载是比较高的，也可能会因为没有CPU时间去处理健检查的回应，这样就有可能导致健康检查失败。

除此之外，因为对于阿里云的负载均衡而言，健康检查使用的都是私网地址实现的，所以如果根本没有监听到私网地址或者私网地址本身存在故障也会导致健康检查的失败。

还有服务器上可能存在防火墙，将监听端口屏蔽掉了，导致健康检查并未通过。

此外还可能存在一些配置方面的问题，比如提供服务的端口和做健康检查的端口不一致也可能存在健康检查失败。

针对于TCP的健康检查而言，很多用户会经常看到自己的后端服务器上日志上面有很多10或者16这些网段的访问，并且访问流量还比较大，这是因为之前所提到的健康检查具有一定的间隔时间，比如2秒或者3秒一次。

这时候一些用户可能就会认为健康检查会影响服务器的性能，占了很多的服务器的连接数。

其实可以从上图中左侧的报文交互情况看到，当SLB对于云服务器发起健康检查的时候首先会发一个SYN的请求，如果服务器端口是存活的，那么它会回应一个ACK，这个时候SLB端就会紧接着发送RST报文。

也就是说实际上连接是并没有建立的，所以也不会占用后端服务器的连接数的资源，并且对于性能的影响也是极为有限的。

为啥会失败(HTTP) HTTP常见的健康检查失败原因大概会有这样的三点：最常见的情况就是有些用户把服务器的HEAD请求方式禁掉了，因为默认在使用浏览器或者手机等请求一个页面的时候使用的都是GET方式，有时候可能需要上传数据则会使用POST方式，虽然很多服务器都支持HEAD请求方式，但是有些服务器可能会处于安全或者其他复杂因素的考虑将HEAD请求禁掉。

所以在这里建议客户将服务器的HEAD请求方式打开，因为阿里云负载均衡七层健康检查方案就是使用的HEAD方案。

另外一种常见情况就是页面访问本身上就存在问题，这样的情况下健康检查也是无法通过的。

最后一种常见情况就是期望结果配置错误，针对于七层的健康检查是通过使用HEAD请求方式去请求页面，页面返回码可能会是200、300或者400以及500等，用户可以在健康检查的配置中设定预期的正常情况下的返回码值，当健康检查返回码值与预期值不一致就会判定健康检查是失败的。

为啥会失败(UDP) 这里介绍一下UDP健康检查的原理。

首先，健康检查通过SLB向后端发送UDP报文探测来获取状态信息。

SLB会周期性地给后端ECS发送UDP报文，如果UDP端口的业务处于正常情况，则没有任何回应。

而当服务出现问题，比如指定的UDP服务端口处于不可达的情况或者无服务的状态的时候，会回复ICMP的不可达报文。

这里也会存在一个问题就是如果后端服务器已经变成了网络中的孤岛，比如出现了整个服务器的掉电、关机情况这样完全不能工作的状态，这时候的ICMP不可达报文是永远不可能收到的，因为后端的服务器无法收到SLB发来的UDP探测报文，那么在这种情况下，可能会出现误认为后端健康的情况，但是实际上这个服务可能已经宕掉了。

为了应对这种情况，健康检查还提供用户自定义UDP应答报文来实现精确的UDP健康检查，也就是由用户自定义指定一个字符串，当后端的云服务器收到UDP健康检查的探测的时候，也回应指定的字符串，之后SLB对于这个字符串进行对比和校验，如果匹配成功则认为服务一定是健康的，这样就可以实现非常精确的健康检查。

而UDP的健康检查失败也有很多原因，比如在协议栈里面有可能会有ICMP限速保护。

当频率达到一定速率的时候，ICMP会被协议栈限制，后端无法回应ICMP不可达报文，进而导致SLB收不到ICMP的报文，出现健康检查的失败情况。

所以这部分是需要注意的，如果可能尽量将速率限制放大一些。

其他问题健康检查时好时坏的可能原因如下： HTTP类型健康检查目标URI响应慢。

比如本身是动态页面，会涉及到大量的计算才能够渲染完成并返回到前端，这样肯定就会导致健康检查响应比较慢。

如果服务器负载过高同样也会出现这样的问题。

未全部放开对SLB健康检查源地址的限制导致分布式健康检查失败。

因为阿里云的服务器都是分布式的部署，健康检查也会是分布式的探测，LVS等机器在后端有不同的源去针对某一个云服务器进行探测的，所以如果没有将这些源地址都放开，实际上也会影响健康检查的效率，因为对于这么多机器而言，只要有一台机器检测到是正常的那么就是正常的。

还可能出现直接访问正常，但是健康检查失败的情况。

造成这样情况的可能原因如下：防火墙限制。

目的端口不一致。

检查方法不同，可能使用浏览器看页面是没问题的，但是健康检查却不行，这就是因为刚才所提到的HEAD方法没有开启。

或者七层的健康检查配置了URL按照域名转发，但是在浏览器上直接访问则是使用域名去做的，而健康检查是使用IP地址做的，这样也可能出现转发和预期结果的不同。

检查频率不同，ICMP限速。

五、为什么负载不均衡调度算法与会话保持首先介绍一下负载均衡的调度算法。

阿里云的负载均衡支持三种算法，第一种算法是单纯的轮询(RR)，也就是将业务的请求依次地分发到后端的服务器。

第二种算法是加权轮询(WRR)，也就是在处理调度的时候会根据针对于每一台后端服务器设置权重来进行转发。

这里之所以设置权重是因为后端服务器的处理能力可能是不同的，如果使用相同的权重进行轮询可能就会把后端处理能力比较弱的服务器挤爆，所以需要针对于服务器的处理能力设置一些权重。

第三种算法是针对于加权最小连接数的轮询(WLC)，也就是除了根据每台后端服务器设定的权重值来进行轮询，同时还考虑后端服务器的实际负载，也就是连接数。

当权重值相同时，当前连接数越小的后端服务器被轮询到的次数也越高，这样就能够保证负载尽量地均衡。

如果不考虑这一点就会造成某些服务器连接数已经很高了但是流量依然还往上面分发，而另外一些服务器却一直处于空闲状态。

会话保持指的是来自同一用户请求始终保持分发到同一台后端的云服务器上。

对于同一用户而言，使用的是四层的负载均衡和使用七层的负载均衡在理解上是不一样的。

如果是四层负载均衡，则会使用源IP地址标识同一用户，所以如果在可能会有很多办公电脑的大型企业中，这些电脑在企业内部是通过局域网的IP进行通信的，在访问公网的时候都是通过NAT网关处理的，所以在走到Internet的时候，源地址通常会是一个或者很有限的几个。

在这种情况下，如果是四层的负载均衡就会把里面所有的请求都视为来自同一个用户的，这种情况下如果开启了会话保持，就会发生问题。

而七层的负载均衡是根据用户浏览器中的Cookie来进行唯一识别的，对于刚才的案例在大型企业里面因为内网访问公网的源地址都是一样的，导致没有办法识别到底是不是同一个用户，此时建议使用七层的负载均衡方案解决，因为Cookie是每个浏览器都唯一的。

会话的保持时间是可以在控制台上配置的，四层的负载均衡方案最大可达1小时，而七层的方案最大可达24小时。

为何不均衡最后分享一下不均衡的常见情况。

有时候会需要新加一个服务器进来，这时候往往到新加进来的服务器上的连接会很少，这是因为可能会存在以下原因：存在会话保持的情况下，会话保持会让请求停留在原有的服务器上，这样到新加进来的服务器上的连接自然会少一些。

权重设置不一致，如果在权重的设置上存在区别，而新加进来的服务器的权重如果很低，连接也过不去。

应用属于长连接类型，因为需要在TCP上复用，如果客户端不主动断开连接，后续所有的请求都会继续复用当前服务器上的连接，只有新建连接才有可能到新的服务器上。

而有时候在业务量或者新建连接较少时，也会出现负载不均衡的问题。

这是因为每个Core都是独立的调度单元，因此可能存在将某个Client的多条业务经过不同core的调度后全部转发到一台ECS上的情况，同时由于业务量较少，因此出现了不均衡。

建议使用轮询算法解决，在RR轮询算法中加入了扰乱因子，可以更加有效的打散SLB到后端的转发路径。

原文链接

云服务器集群的常见误区：识别和避免管理云服务器集群时常见的陷阱 (云服务器集群和普通服务器的区别)

云服务器集群和普通服务器的区别

云服务器集群的常见误区

1. 将所有服务运行在同一个集群上

2. 忽略容错和高可用性

3. 过度扩展集群

4. 忽略安全配置

5. 缺乏监控和告警

避免误区，提升集群管理效率

云渲染一定比本地渲染快？云渲染常见误区系列（一）

云计算技术是什么意思？

负载均衡进阶：SLB常见问题解决方法

相关推荐

置顶推荐

热门标签

优乐评测网找服务器更专业更方便更快捷！

专注IDC行业资源共享发布，给大家带来方便快捷的资源查找平台！

云服务器集群和普通服务器的区别

云服务器集群的常见误区

1. 将所有服务运行在同一个集群上

2. 忽略容错和高可用性

3. 过度扩展集群

4. 忽略安全配置

5. 缺乏监控和告警

避免误区，提升集群管理效率

云渲染一定比本地渲染快？云渲染常见误区系列（一）

云计算技术是什么意思？

负载均衡进阶：SLB常见问题解决方法

相关推荐

置顶推荐

热门标签

优乐评测网 找服务器 更专业 更方便 更快捷！

专注IDC行业资源共享发布，给大家带来方便快捷的资源查找平台！

优乐评测网找服务器更专业更方便更快捷！