如何执行VLAN故障诊断

日期: 2022-10-29 作者:Terry Slattery翻译:邹铮 来源:TechTarget中国 英文

出于各种原因,虚拟LAN或VLAN技术可能会出现故障。由于物理连接、不正确的第2层数据链路配置错误或第3层路由网络配置问题,可能会出现VLAN连接问题。

以下是对VLAN连接问题进行故障排除时需要采取的步骤。

物理连接

为了确保网络正常运行,首先必须存在基本的物理连接。在物理连接方面,典型问题包括电线或光缆断裂、光连接器上的灰尘或污垢、连接器损坏、电气系统干扰或挤压的电缆。

其中很多问题表现为单向链路,其中数据包沿一个方向而不是另一个方向。网络设备可以频繁地检测单向链路,从而更容易使用简单的命令(例如显示接口)进行诊断。管理员需要检查输出中的接口状态和错误计数器,以确定特定类型的问题。

双工不匹配

在低速以太网链路上,检查双工设置。链路的两端必须配置为相同的双工设置(自动、全双工或半双工)和速度。双工不匹配可以在低数据包速率下工作,而在较高的数据包速率下失败,因此不要依赖于简单的ping测试。显示延迟冲突的接口处于半双工状态,与全双工接口进行通信。如果连接的设备处于半双工状态,则全双工接口会显示残缺帧。大多数设备的推荐设置为自动。

不正确的虚拟网络设置

最常见的数据链路错误是端口的VLAN ID配置不正确,或者省略了连接IP电话的端口上的语音VLAN ID。这种链路看起来不错,并且数据包计数器递增,但是没有连接性。在这种情况下,管理员应运行配置的简单检查。

中继

在中继链路上,管理员需要设置本地 VLAN,这会告诉交换机对于不携带VLAN ID的任何帧应该使用哪个VLAN。此ID在整个网络中通常是一致的,管理员只需执行简单的配置检查。

交换机到交换机链路通常使用中继通过单个链路传递多个VLAN。允许的VLAN列表必须在链路的两端匹配。不匹配可能导致VLAN的孤立实例。连接适用于某些终端,而不适用于其他终端。在这里,对交换机中继接口运行简单的配置检查。

上述配置检查是应用配置验证自动化的理想位置。这些检查不需要应用更改-它们只需要向网络人员突出显示潜在问题。

交换网络中的转发环路

交换网络传统上依靠生成树协议(STP)来防止转发环路。但是,在某些情况下,即使使用STP也可能发生环路。环路围绕环路快速转发以太网帧,这会消耗接口带宽和交换机CPU。它很快导致网络变得非常拥挤,以至于停止运行。不幸的是,由于CPU和网络链路饱和,因此无法使用网络来诊断问题。

要进行故障排除,管理员应将网络分解为连续较小的域,以确定环路的位置。在中间划分网络,并确定哪一半包含环路。管理员可以重复细分过程,直到他们确定环路所在的交换机和互连的接口。最好在实验室环境中练习此操作以学习该过程。供应商还创建了单向链路检测、环路防护、根防护和 BPDU 防护等功能,以防止不同类型的环路。

单播泛洪

在极少数情况下,交换机可能会忘记端点在VLAN中的位置,从而导致称为单播泛洪的情况。当交换机的媒体访问控制地址到端口缓存计时器与VLAN的路由器IP地址到MAC地址缓存不同时,会发生这种情况。交换机忘记给定MAC地址所在的端口,从而导致交换机将发往MAC地址的任何帧淹没到VLAN中的所有端口。多种网络拓扑和方案都可能导致此泛洪。如果受影响的系统发送大量数据(例如执行磁盘备份),则VLAN上的所有系统都将遭遇较大负载。

当受影响的VLAN上的终端系统变得缓慢,并且VLAN增量中所有接口上的数据包计数器以相同的速率出现时,管理员可以识别此问题。一种选择是将MAC地址到端口计时器设置为略高于IP地址到MAC计时器。或者,交换机供应商部署功能以通过限制未知单播泛洪操作的数量来帮助避免高负载。这些是特定于供应商的命令,因此管理员应与其提供商联系。

第3层(路由网络)问题

另一类问题会影响VLAN与第3层网络其余部分的连接。在这些情况下,VLAN运行正常,但其外部连接不起作用。如果管理员可以ping子网上的至少一个其他系统,则基本的第2层连接正在运行,这可能是第3层问题。也有例外对情况,因此请对其他方案持开放态度。

端点配置

如果问题出在单个终端上,请检查其IP地址是否位于正确的子网中,并且具有正确的子网掩码。配置不正确可能是由于配置过程中的拼写错误或端点的交换机接口上的VLAN ID配置错误而导致的,这会将其置于错误的VLAN/子网中。

网关配置

管理员应该能够ping子网上的默认网关以及同一子网上的相邻系统。如果相邻系统响应 ping,但默认网关不响应,则有两种可能的情况导致此问题。

第一种可能是默认网关未正确配置。这可能是缺少交换机虚拟接口(SVI),或者将VLAN连接到第3层路由网络的路由器丢失、配置错误或未处于“启动”操作状态。管理员接下来应诊断SVI或路由器连接,并在验证后返回到故障的终端。进一步的测试可能需要管理员返回到上述第2层测试方案。

第二种可能性是该终端的默认网关子网掩码错误。此方案的症状是终端可以ping通VLAN/子网中的某些(但不是全部)其他终端。它是否可以到达默认网关并将数据包正确路由回去取决于所涉及的特定地址。同样,在这种情况下,网络验证自动化是很大的帮助。

总结

网络故障排除最佳选择始终是使用分治法。观察症状,并确定问题出在物理层、数据链路层、路由层还是应用层。确定连接失败的位置和原因,然后开始检查与该层相关的特定项

目。测试每个潜在的故障,以确定问题所在,并确定需要纠正的内容。VLAN故障排除是通过经验学到的一项宝贵技能。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐

  • 有必要部署网络自动化吗

    企业、供应商和网络专业人士都认为网络自动化有必要。然而,事实是,不是每个人都需要网络自动化。 曾经,专业人士对 […]

  • SASE与SD-WAN:有什么不同?

    远程工作者的需求会随着时间的推移而变化,并且分散在不同地理位置,这里的事实是:传统技术无法满足这些需求。 这一 […]

  • 如何避免互联网黑洞

    黑洞是太空中具有强引力的区域,以至于包括光在内的物质无法逃脱其拉力。一旦有东西进入黑洞,就不可能返回。互联网黑 […]

  • 收入下降导致思科裁员4000人

    由于对全球经济的担忧客户减少支出,以及产品安装速度低于预期,思科削减了数千个工作岗位。 周三,思科证实,其员工 […]