又拍云邵海杨 – 25年Linux老兵,聊聊运维的“术”与“道”
我是邵海杨,来自又拍云。
自1998年接触Linux,至今已逾25年,我是一位资深的Linux系统运维/架构师,也是DevOps八荣八耻的倡导者。
在系统优化、网络服务管理、Linux系统定制、CDN加速、安全防御、互联网高性能网络架构设计、虚拟化KVM、OpenStack云平台、K8S容器云及Ceph分布式存储等领域均有涉猎。
我热衷于交流和分享,活跃于社区,积极参与开源活动。
在云运维领域,公司通常会制定一系列运维准则和操作规范。以又拍云为例,我们的运维经验包括以下几点:
为了促进运维团队成员的成长,公司采取了积极的措施,包括内部培训和技能树的盘点,以及与人事部门合作的OKR目标管理。
在管理岗上,对于刚晋升的运维管理人员,我的建议是及时梳理技术债务,进行人才技能的盘点和培养,确保基础牢固,以促进更进一步的成长。
关于Kubernetes的应用,它代表了DevOps的最佳实践,但并非所有场景都适合使用。
例如,CDN边缘服务器、数据中心日志分析平台、Ceph分布式存储通常以物理机为主。
因此,应寻找合适的场景进行试用,如容器化应用、微服务架构等。
运维与研发的协作是紧密的。
在工作边界划分上,我们可以将运维工程师比作冲锋陷阵的将军,而软件工程师则是坐阵帐中的军师。
通过优化软件设计,例如分库分表、大并发设计等,可以减轻运维的工作压力。
同时,通过引入自动化工具,实现监控和报警系统,可以提升运维效率。
面对沟通不畅的情况,关键是明确责任和团队协作。
例如,在提供高并发能力时,需要考虑冗余和预算限制,而在软件设计不佳导致性能问题时,需要追究设计者的责任。
故障文化强调关注问题本身,而不是个人,通过复盘学习提升团队能力。
运维工作的目标包括运维自动化、监控常态化和日志可视化。
工具选型时,通常会优先考虑使用成熟的开源工具或商业产品,以避免重复造轮子。
在迁往公有云的背景下,SRE团队的核心职能侧重于顶层设计、高可用性和分布式弹性,团队价值在于跨平台协作和持续学习。
对于运维工程师,转型路径可能包括技术领域和非技术领域的发展。
职业规划建议是注重复合型技能的培养,如业务理解和编程能力,同时保持学习的热情。
最重要的是表达沟通能力,以及在技术、管理和业务层面的综合能力。
对于新入行的运维人员,寄语是持续学习,培养技术与沟通能力,适应快速变化的技术环境。
运维管理的对象分类应考虑哪些因素
运维管理的对象分类应考虑因素如下:
1、技术架构:不同的技术架构(如分布式系统、云计算平台、传统集中式系统等)对运维的需求和挑战不同。
例如,分布式系统可能需要更复杂的配置和监控,而云计算平台则需要关注资源管理和安全控制。
2、业务领域:不同的业务领域(如金融、电商、制造业等)对运维的要求也不同。
例如,金融领域可能更注重数据安全和稳定性,而电商领域可能更注重响应速度和弹性扩展。
3、系统规模:系统的规模(如大型、中型或小型)也会影响运维的策略和工具的选择。
大规模的系统可能需要更高级的自动化工具和运维团队。
4、数据类型:数据的类型(如结构化、非结构化、流数据等)对存储、备份和恢复策略有重要影响。
例如,非结构化数据可能需要更复杂的存储和检索策略。
5、法规和合规性要求:在某些行业或地区,可能存在特定的法规和合规性要求,这会影响运维策略和工具的选择。
运维管理的特点:
1、应用灵活简便:现代运维管理系统通常基于B/S架构,这意味着用户可以随时随地通过浏览器进行访问和管理,无需安装客户端。
界面设计也通常采用图形化方式,直观易懂,使得系统信息和运行状态一目了然。
这种灵活性不仅简化了管理流程,还提高了工作效率。
2、运维管理全面:优秀的运维管理系统不仅能管理基础设施的关键设备,如服务器、路由器和交换机等,还能对所有系统核心设备的全面信息和运行维护的全过程进行管理。
这意味着从硬件到软件,从物理层到应用层,所有的资源都能得到有效的监控和管理。
3、完全在线管理:基于网络的在线式管理是运维管理的另一个重要特点。
通过实时获取所有联网设备的状态和参数信息,管理者可以迅速做出决策,确保系统的稳定运行。
此外,这种在线管理方式还使得远程管理和控制成为可能,大大降低了运维成本。
4、高度可扩展性:随着技术的发展和业务需求的变化,运维管理必须具备高度的可扩展性。
这包括对新技术和新设备的支持、系统的模块化设计、以及强大的自定义功能等。
这样,企业可以根据自身的需求灵活地进行系统配置,确保运维管理始终与业务发展保持同步。
好用的项目管理软件推荐个?
可以关注下众安科技项目管理软件,众安科技项目管理平台DevCube Team是一站式研发协作平台,通过整合业务、产品、研发、运维等角色端到端的协作过程,打通研发管理全流程与全场景,赋能敏捷、瀑布等研发管理过程的效能提升。
支持自定义组件化项目模板、工作流配置、角色聚焦、敏态、稳态等多模式项目管理模式,快速响应市场变化,对需求进行全周期管理。
拥有系统角色、项目角色、数据角色等角色划分,支持按团队组织结构、全局用户组和项目角色分配权限,成员有序分工保障数据安全。
详情可访问众安科技官网