网络故障——自上而下的故障修复方法

日期: 2009-05-06 作者:Carrie Higbie翻译:曾少宁 来源:TechTarget中国 英文

有“大量工具”可以辅助管理员发现网络什么时候出故障了,同时也几种方法可以用来应对这些警报。但是哪种方法是最佳的呢?可以说,没有。没有任何一种方法适用于所有情况。本文将阐述故障修复中所使用的几种方法,以及在什么情况下它们不足以作为永久修复的手段。

基本上故障修复的方法有两种,自上而下和自下而上。现在,我们将探讨自上而下的方法,而在下一章节中,我们将探讨自下而上的方法。 在自上而下的方法中,我们从OSI协议栈的最上层开始分析。我们要先测试应用是否正常工作,然后ping服务器,等等。

直到我们到达协议栈的最底层,也就是物理层。这个方法最适用于多用户进行服务台呼叫的情况。物理层问题几乎很少可能成为影响所……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

有“大量工具”可以辅助管理员发现网络什么时候出故障了,同时也几种方法可以用来应对这些警报。但是哪种方法是最佳的呢?可以说,没有。没有任何一种方法适用于所有情况。本文将阐述故障修复中所使用的几种方法,以及在什么情况下它们不足以作为永久修复的手段。

基本上故障修复的方法有两种,自上而下和自下而上。现在,我们将探讨自上而下的方法,而在下一章节中,我们将探讨自下而上的方法。

在自上而下的方法中,我们从OSI协议栈的最上层开始分析。我们要先测试应用是否正常工作,然后ping服务器,等等。直到我们到达协议栈的最底层,也就是物理层。这个方法最适用于多用户进行服务台呼叫的情况。物理层问题几乎很少可能成为影响所有用户的问题,当然,除非遇到服务器连接问题时。这个方法可以用来确定应用或服务器是否DOWN了、变慢了,或者其它某些原因没有响应网络命令。为了有效地运行,它往往是在某种工具或者网络监控应用协助下工作的,这些工具和应用是可以提供某种有规律和可操作的数据。

可操作的数据可能是简单的ping,可能所有监控通过SNMP陷阱传输的位错误和其它错误的结果都是主机无法访问。然而,真正的目的是确定错误的起因。为了有效地实现,必须有一个系统故障修复计划。这当然不只包含重启服务器。如果服务器出现故障,那么它一定是由于某些原因引起的。虽然原因可能是内存泄露、处理器过度使用,或者其它问题,但是重启只能作为临时方法,而非根本的解决方案。因此,这时的可操作数据是什么呢?就是能够提供足够有用和明确的信息来确定行动计划的数据。

大多数管理软件包和监控工具允许网络管理员设置超出性能外的可接受范围的限制。想要掌握应该在哪里可以为特定问题设置限制是需要不断地探索的。设置值过低将会造成警报过密,设置过高将会导致系统死机。盲目地接受默认设置可以导致工具利用率不高。任何时候部署管理软件,我都建议花点钱接受培训。最理想的培训是请通过软件包认证的人来做实地培训——在实际环境中。这样我们就可以删除不想要或者不需要的模块,同时优化能为我们提供最好信息的模块。带宽消耗大的应用和负载高的服务器最好进行更多的调优。

管理软件的另外一个优点是它能够查询不同的设备和在报告工具中保留数据统计和变化趋势。以前,我们必须根据服务器软件和激活的电子器件来双击各种不同接口上的每台交换机来查看 ,至今很多环境仍然采用这种方法。这太繁琐了!现在,只要一个工具,就可以对趋势分析和综合流量报告进行导出、排序操作等等。这些也可以用来调整新的设备和升级(这只是一个附加功能)。趋势分析和利用模型的一个优点是它允许我们确定哪些服务器可以受益于多网卡。同时,它也允许我们将交换机进行分组,这样我们就可以平衡每台交换机的总数据包,同时就不会出现有的交换机负载过高而有些使用不足。而且它还有助于我们了解各种类型的数据包的流向,从而可以对它们进行优化。

在下一篇文章中,我将探讨自下而上的方法

作者简介

Carrie从事计算机和网络产业已经有近20个年头了。她曾在制造公司、医疗机构、娱乐场、保健公司、有线和无线公司工作,同时,她还从事为私人咨询公司和新兴Network and Software Solutions提供网络设计/实施、项目管理和软件开发的各种不同行业的工作。

Carrie目前在The Siemon Company工作,她的职责包括为电子制造商提供联络服务来确保激活的电子产品和目前及将来的布线基础设备之间的一致性。她还参与了IEEE、TIA和各种组织的验收标准的工作,同时她还致力于进一步培训终端用户社区关于基础设备质量重要性的认识。Carrie目前拥有BICSI的RCDD/LAN专家证书,Novell 的MCNE以及其它的证书。

作者

Carrie Higbie
Carrie Higbie

TechTarget中国特约专家 关于作者:作为Siemon公司的全球网络应用经理,Carrie为终端用户和电子社区服务。她在过去两年获得“Communication News”编辑推荐奖。参见专家答疑页面查看她的更多文章。

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐