IT运维管理是一门探讨如何提高网络应用性能的课题,怎样利用网络管理做到企业IT基础设施建设的管理、合理分配网络资源、保障生产业务、对网络规划和新业务上马提供支撑。但在IT运维管理中最具挑战性的工作无疑就是“调优”,而面对这个庞大的话题,你有什么好思路吗?面对那些服役多年的业务系统,你是否能让它重现活力?
调优的难点:“线上系统”
调优工作有难易之分,最简单的例子就是新、旧两套业务系统,后者明显需要更多的理解和数字变化上的感知。以大型企业为例,当新业务上线时,由于业务的数据特征、流量特征、访问特征都存在不确定性因素,因此往往需要在上线前、上线后、运行过程阶段,对关键的基础设施和应用层进行持续的配置调优。而对于已运行的系统,也就是线上系统,我们不可能将其环境完整地复制出来“做试验”,所以就必须依赖长期的监控,获取到系统的运行数据,找到现阶段的瓶颈,有针对性的提出优化方案。
不过有人认为,针对线上的系统调优,只能聘请专家级的人物来做。对此,国内领先的IT运维管理专家北塔软件表示:调优的效果取决于量化的数据和理性的目标,不论是在企业内任职的IT运维工程师还是外聘的专家,这都是必不可少的。另外,我们所做的基础设备层面或是开发层面的优化,如果不熟悉企业自己的业务,不围绕业务层面做优化,就会与决策层的期待值相差甚远。所以说,针对线上系统,如果缺少数据支撑,就不可能在业务层面实现调优,也就失去了优化工作的真正意义。
有人将调优称为“黑色艺术”,就因为它依靠着数据和感觉,在理性和感性间徘徊。但如果要让别人欣赏你的“艺术作品“,业务层的调优则是见效最快、展现IT运维价值最好的窗口。但业务部门不会关心CPU占用了多少、内存够不够、链路参数是否需要调整……这种底层的问题,他们对于调优的看法是整个业务的流程会不会更快。
调优的本质:“迭代优化“
要进行优化,先得找到性能瓶颈! 而北塔软件提供的北塔BTIM恰恰从这个出发点,帮助IT运维工程师切入了调优的关键点。对于业务使用管理,北塔BTIM提供了业务仿真、业务数据流图、业务用户监控3个功能项,从业务关键路径的响应时间、业务的时间分布、业务在具体网络中的负载路径,分析业务支撑系统性能指标,帮助用户及时调整网络部署和运维安排,实现“更好用、更快捷“的业务系统服务。
一个业务系统是否健康,业务量是否饱满,如何看待各类系统运行参数,这些都是和在线使用情况直接相关,业务性能分析不能脱离业务负荷这个前提。但传统意义上的网络拓扑图只能提供出网络之间的流量大小,但是这些流量的大小往往是物理上的流量。对于业务系统来说,管理人员迫切需要通过对物理流量的分析,了解某项核心业务是否出现了异常,是否有调优的必要。
对此,结合上述需求,北塔软件提供了业务流量分布图,它以物理拓扑为基础,业务流量为骨干,透明化的展现了业务数据在网络中的真实路径,并实时展示各路径上的业务流量及用户接入设备。通过此管理图,可以快速定位业务关键路径和边缘设备,确定重点业务设备,根据这些数据分析结论,提出优化建议。而业务仿真系统,可以实现对业务各关键路径7X24小时监控,通过对于各关键路径的响应时间分析,并结合支撑组件的情况进行智能梳理,可帮助运维人员直击性能瓶颈。
最后,在诸多行业用户中,拥有丰富经验的北塔软件还提醒用户:性能优化未必一次性就能满足,可能此处瓶颈消失了,系统一旦运转之后,业务层面的调整还会在其他地方又发现新的性能瓶颈。所以,性能优化是一个迭代的工作,循环往复,直至满足系统需要的性能指标,而这也正是IT运维管理工作在企业中的一大价值所在。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
云网络时代,IT运维管理如何做到透明可视?
随着技术的演进、应用的发展,企业服务器、网络变得愈发虚拟化,且越来越多的企业趋向于将业务迁至云平台,这无形中给企业IT运维管理带来挑战。对于企业运维管理人员来说,需要采集各个系统的数据进行分析与管理,以最大程度实现运维管理的透明可视。
-
攻城狮是这样迎来IT运维管理的春天的……
企业业务的增加给IT部门带来挑战,特别是对于那些负责IT运维管理的攻城狮们来说,管理对象越来越多,环境越来越复杂……
-
视频监控“大联网” 平安城市运维亟需“流程化”
自平安城市项目开始推广以来,有一些地方的监控设备屡屡出现问题,平台的运维管理难度也愈加凸显,这些问题得不到有效解决,平安城市进程势必受阻。
-
北塔:寻找IT运维管理中的“阿喀琉斯之踵”
寻找IT运维管理中的“阿喀琉斯之踵”,不会让IT故障从此消失。不过,“让运维系统自动发现故障要比手动检测快得多,快速解决复杂应用问题需要大量的细节指标”这两点还请牢记。