如何确保网络性能和可靠性

日期: 2025-03-27 翻译:邹铮 来源:TechTarget中国 英文

对于网络而言,网络可靠性至关重要。可靠性可确保最低限度网络中断,这可帮助企业避免财务损失和生产力下降等情况。

本文将讨论维护网络可靠性和提高性能的最佳实践,包括网络协议、性能优化策略、服务质量(QoS)、微服务和配置工具。网络专业人士可以遵循这些准则来避免网络停机,并缓解性能不佳的情况。

使用网络协议来确保可靠性

网络协议是网络通信的关键组成部分,对于保持网络可靠性,网络协议非常重要。网络协议创建规则,定义数据如何通过网络传输。这些规则使设备能够在网络中高效地通信和交换信息。

可确保可靠性的关键网络协议包括以下:

  • 第一跳冗余协议(FHRP)。
  • 开放式最短路径优先(OSPF)。
  • 边境网关协议(BGP)。

第一跳冗余协议

冗余涉及添加额外的机制,作为故障时的备份。关键在于确定故障点是网络中的低风险点还是高风险点。

FHRP通过在发生故障时自动将流量重新路由到备份设备来提供冗余。它有特定于供应商的部署和非供应商的部署,例如虚拟路由器冗余协议(VRRP)。

VRRP配置在主设备和备份设备的接口上。主设备和备份设备共享一个虚拟IP地址。主要设备通常处理流量。但是,如果主设备出现故障,VRRP 会重新分配虚拟 IP 地址,并将流量重新路由到备份设备。当主设备恢复时,它会重新接管流量,并恢复其角色。

如果VRRP位于数据中心网络的第3层交换机上,请考虑生成树协议(STP)配置。VRRP主交换机应作为STP根交换机来保持网络稳定性。此外,对象跟踪监控非VRRP接口的状态。如果备份设备停机,则会接管,这进一步提高可靠性。

开放式最短路径优先

OSPF可以快速检测路由器链路上的故障,并使用最短路径优先算法重新计算最佳路线。然后,它使用链路状态通告(LSA)数据包将这些路由广播到所有相邻的OSPF路由器。

然而,OSPF可能存在可扩展性挑战。在泛洪LSA数据包和重新计算路由时,路由器会投入带宽,这给路由器的CPU带来压力。在拥有数百个路由器的大型企业网络中,一个拓扑结构更改(例如链路故障)可能会触发LSA泛洪,并导致每个路由器重新计算路由。为了解决此问题,请将路由器分组到OSPF区域,以减少不必要的更新。

边境网关协议

BGP是互联网路由的主干。网络专业人员可以对路由器进行分组,并将其放置在共同的行政控制和路由策略中,以形成自治系统(AS)。每个AS通常由ISP管理,都有唯一的编号。这些唯一数字或ASN使多个AS能够互连,并保持路由控制。

在配置BGP时,最佳做法是在AS中形成BGP邻居,AS具有回环接口而不是物理接口。

然而,BGP存在可扩展性问题:所有路由器之间必须形成BGP邻居。以下方法可帮助解决这个问题:

  1. 路由反射器。指定的路由器形成邻居,并反射路由到其他路由器。例如,原本有3个路由器,需要3个链接,而路由反射器可将其减少到2个连接。
  2. BGP联盟。网络专业人士可以将大型AS划分为较小的子AS,称为BGP联盟,以使路由更容易管理。互联网服务提供商可以通过将整个大陆的网络划分为区域子AS来简化路由,从而更大规模地做到这一点。

网络性能优化策略

除了提高性能外,网络性能优化策略还可以确保可靠性。以下策略可帮助提高网络性能:

  • 双向转发检测(BFD)。
  • 路由汇总。
  • 负载共享。

双向转发检测

OSPF将默认失效时间间隔设置为40秒,这意味着路由器必须等待很长时间才能声称邻居离线。网络专业人员可以将此间隔缩短到一秒钟,以改善故障检测,并显著增加CPU负载。控制平面必须处理频繁的HELLO数据包,更新邻居表,并不断重新计算路由。

然而,BFD与路由协议配合使用,在不压倒CPU的情况下实现低至50毫秒的亚秒故障检测。BFD在数据平面水平运行,并将故障检测转移到专用硬件,这使得硬件能够快速响应,而无需过度计算。

路由汇总

路由汇总将设备上的不同接口地址汇总为单个前缀。然后,它将此摘要发布到网络其他部分的设备,例如OSPF区域、BGP AS或数据中心层。

路由汇总可提高性能,因为它缩减路由表的大小。当设备故障导致路由重新计算时,它会最大限度地减少路由器的CPU负载。路由汇总可减少路由器需要处理的单个路由更新的数量。

路由汇总还通过汇总多条路由来确保可靠性并提高性能。但是,它可以创建路由循环。为了防止这种情况,请保留AS路径属性。例如,如果AS 65001汇总一条路由,而AS 65002则将其传回,AS 65001可以在AS_PATH中检测到自己的AS并拒绝它。

负载共享

负载共享确保流量可以同时使用多个出口点。这与VRRP不同,VRRP使用一个出口点设备,直到它失效。

只有在启用BGP多路径时,BGP中才能进行负载共享。此功能将多个同等成本的BGP路由安装到路由表中。当多个目标接口成本相等时,OSPF使用相同的做法。

服务质量

QoS通过管理拥塞和优先处理关键流量来确保网络可靠性,并提高性能。以下QoS技术可帮助管理拥塞:

  • 队列管理。
  • 流量整形。
  • 带宽监管。

队列管理

在拥塞期间,通过缓冲部分流量并允许其他流量流动,队列管理可帮助流量流动。现在有很多队列类型,例如低延迟队列,它优先考虑实时流量(例如VoIP),而不是其他流量。

流量整形

流量整形调节流量的方法是,通过缓冲多余的数据包,并以受控的速度释放它们。这可以防止突然的流量激增,从而可能会压倒路由器。

要验证QoS策略是否正常工作,请使用Wireshark的I/O图来可视化流量模式,并识别任何异常情况,例如数据包掉线和延迟峰值。

微服务

微服务依赖于快速稳定的网络进行通信。导致网络不可靠且性能低下的常见问题包括:未检测到的故障、不受控制的IP地址分配和高延迟。提高可靠性和性能的方法包括以下内容。

  • 监控工作量。
  • 使用配额控制IP地址分配。
  • 在云部署中,优化网络接口卡(NIC)。

监控工作负载

在进行故障排除时,指标、日志和跟踪可以帮助团队全面了解整个网络。指标可让团队了解网络及其应用程序的运行状况和性能。日志则记录这些事件,以提供事件发生的详细历史记录,分析过去的活动,并识别和预测未来的网络行为。跟踪跟踪网络上的数据流,以确保数据可以在设备之间正确传输。

控制IP地址分配

在大规模的Kubernetes部署中,不受控制的IP地址分配会导致枯竭。如果没有可用的IP地址,团队将无法安排新的pod,网络通信中断,关键服务故障。这最终降低整个集群的可靠性和性能。

为了解决这个问题,如果集群支持IPv6,请使用IPv6。如果没有,请使用IPv4 /8前缀,例如10.0.0.0/8。如果网络使用容器网络接口(CNI),例如Calico或Cilium,请通过定义集群中每个节点的特定IP地址范围来控制IP地址分配。

优化云VM NIC

在多节点Kubernetes集群中,在节点(云VM)上运行的微服务经常交换数据。如果没有高性能网络,每个数据包都会通过虚拟机管理程序,这会增加延迟。

如果网络管理员有虚拟机,可支持增强网络功能,例如Single Root I/O虚拟化,他们可以使用它来提高性能。通过这个功能,数据包会绕过虚拟机管理程序,直接在NIC和VM之间流动。

配置工具和故障诊断技巧

当网络管理员处理网络可靠性和性能问题时,某些工具会派上用场。以下是有用的网络故障排除工具:

  • Ipconfigifconfig这些工具通常位于带有CLI的终端设备上,例如笔记本电脑和PC。当设置互联网访问并配置终端设备接口和默认网关,网络管理员就可以使用ipconfig和ifconfig来验证配置。
  • Ping这个CLI工具可以测试网络中数据包可访问性。
  • Wireshark这个数据包捕获工具,可以在数据包传输时捕获数据包。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐