对于网络而言,网络可靠性至关重要。可靠性可确保最低限度网络中断,这可帮助企业避免财务损失和生产力下降等情况。
本文将讨论维护网络可靠性和提高性能的最佳实践,包括网络协议、性能优化策略、服务质量(QoS)、微服务和配置工具。网络专业人士可以遵循这些准则来避免网络停机,并缓解性能不佳的情况。
使用网络协议来确保可靠性
网络协议是网络通信的关键组成部分,对于保持网络可靠性,网络协议非常重要。网络协议创建规则,定义数据如何通过网络传输。这些规则使设备能够在网络中高效地通信和交换信息。
可确保可靠性的关键网络协议包括以下:
- 第一跳冗余协议(FHRP)。
- 开放式最短路径优先(OSPF)。
- 边境网关协议(BGP)。
第一跳冗余协议
冗余涉及添加额外的机制,作为故障时的备份。关键在于确定故障点是网络中的低风险点还是高风险点。
FHRP通过在发生故障时自动将流量重新路由到备份设备来提供冗余。它有特定于供应商的部署和非供应商的部署,例如虚拟路由器冗余协议(VRRP)。
VRRP配置在主设备和备份设备的接口上。主设备和备份设备共享一个虚拟IP地址。主要设备通常处理流量。但是,如果主设备出现故障,VRRP 会重新分配虚拟 IP 地址,并将流量重新路由到备份设备。当主设备恢复时,它会重新接管流量,并恢复其角色。
如果VRRP位于数据中心网络的第3层交换机上,请考虑生成树协议(STP)配置。VRRP主交换机应作为STP根交换机来保持网络稳定性。此外,对象跟踪监控非VRRP接口的状态。如果备份设备停机,则会接管,这进一步提高可靠性。
开放式最短路径优先
OSPF可以快速检测路由器链路上的故障,并使用最短路径优先算法重新计算最佳路线。然后,它使用链路状态通告(LSA)数据包将这些路由广播到所有相邻的OSPF路由器。
然而,OSPF可能存在可扩展性挑战。在泛洪LSA数据包和重新计算路由时,路由器会投入带宽,这给路由器的CPU带来压力。在拥有数百个路由器的大型企业网络中,一个拓扑结构更改(例如链路故障)可能会触发LSA泛洪,并导致每个路由器重新计算路由。为了解决此问题,请将路由器分组到OSPF区域,以减少不必要的更新。
边境网关协议
BGP是互联网路由的主干。网络专业人员可以对路由器进行分组,并将其放置在共同的行政控制和路由策略中,以形成自治系统(AS)。每个AS通常由ISP管理,都有唯一的编号。这些唯一数字或ASN使多个AS能够互连,并保持路由控制。
在配置BGP时,最佳做法是在AS中形成BGP邻居,AS具有回环接口而不是物理接口。
然而,BGP存在可扩展性问题:所有路由器之间必须形成BGP邻居。以下方法可帮助解决这个问题:
- 路由反射器。指定的路由器形成邻居,并反射路由到其他路由器。例如,原本有3个路由器,需要3个链接,而路由反射器可将其减少到2个连接。
- BGP联盟。网络专业人士可以将大型AS划分为较小的子AS,称为BGP联盟,以使路由更容易管理。互联网服务提供商可以通过将整个大陆的网络划分为区域子AS来简化路由,从而更大规模地做到这一点。
网络性能优化策略
除了提高性能外,网络性能优化策略还可以确保可靠性。以下策略可帮助提高网络性能:
- 双向转发检测(BFD)。
- 路由汇总。
- 负载共享。
双向转发检测
OSPF将默认失效时间间隔设置为40秒,这意味着路由器必须等待很长时间才能声称邻居离线。网络专业人员可以将此间隔缩短到一秒钟,以改善故障检测,并显著增加CPU负载。控制平面必须处理频繁的HELLO数据包,更新邻居表,并不断重新计算路由。
然而,BFD与路由协议配合使用,在不压倒CPU的情况下实现低至50毫秒的亚秒故障检测。BFD在数据平面水平运行,并将故障检测转移到专用硬件,这使得硬件能够快速响应,而无需过度计算。
路由汇总
路由汇总将设备上的不同接口地址汇总为单个前缀。然后,它将此摘要发布到网络其他部分的设备,例如OSPF区域、BGP AS或数据中心层。
路由汇总可提高性能,因为它缩减路由表的大小。当设备故障导致路由重新计算时,它会最大限度地减少路由器的CPU负载。路由汇总可减少路由器需要处理的单个路由更新的数量。
路由汇总还通过汇总多条路由来确保可靠性并提高性能。但是,它可以创建路由循环。为了防止这种情况,请保留AS路径属性。例如,如果AS 65001汇总一条路由,而AS 65002则将其传回,AS 65001可以在AS_PATH中检测到自己的AS并拒绝它。
负载共享
负载共享确保流量可以同时使用多个出口点。这与VRRP不同,VRRP使用一个出口点设备,直到它失效。
只有在启用BGP多路径时,BGP中才能进行负载共享。此功能将多个同等成本的BGP路由安装到路由表中。当多个目标接口成本相等时,OSPF使用相同的做法。
服务质量
QoS通过管理拥塞和优先处理关键流量来确保网络可靠性,并提高性能。以下QoS技术可帮助管理拥塞:
- 队列管理。
- 流量整形。
- 带宽监管。
队列管理
在拥塞期间,通过缓冲部分流量并允许其他流量流动,队列管理可帮助流量流动。现在有很多队列类型,例如低延迟队列,它优先考虑实时流量(例如VoIP),而不是其他流量。
流量整形
流量整形调节流量的方法是,通过缓冲多余的数据包,并以受控的速度释放它们。这可以防止突然的流量激增,从而可能会压倒路由器。
要验证QoS策略是否正常工作,请使用Wireshark的I/O图来可视化流量模式,并识别任何异常情况,例如数据包掉线和延迟峰值。
微服务
微服务依赖于快速稳定的网络进行通信。导致网络不可靠且性能低下的常见问题包括:未检测到的故障、不受控制的IP地址分配和高延迟。提高可靠性和性能的方法包括以下内容。
- 监控工作量。
- 使用配额控制IP地址分配。
- 在云部署中,优化网络接口卡(NIC)。
监控工作负载
在进行故障排除时,指标、日志和跟踪可以帮助团队全面了解整个网络。指标可让团队了解网络及其应用程序的运行状况和性能。日志则记录这些事件,以提供事件发生的详细历史记录,分析过去的活动,并识别和预测未来的网络行为。跟踪跟踪网络上的数据流,以确保数据可以在设备之间正确传输。
控制IP地址分配
在大规模的Kubernetes部署中,不受控制的IP地址分配会导致枯竭。如果没有可用的IP地址,团队将无法安排新的pod,网络通信中断,关键服务故障。这最终降低整个集群的可靠性和性能。
为了解决这个问题,如果集群支持IPv6,请使用IPv6。如果没有,请使用IPv4 /8前缀,例如10.0.0.0/8。如果网络使用容器网络接口(CNI),例如Calico或Cilium,请通过定义集群中每个节点的特定IP地址范围来控制IP地址分配。
优化云VM NIC
在多节点Kubernetes集群中,在节点(云VM)上运行的微服务经常交换数据。如果没有高性能网络,每个数据包都会通过虚拟机管理程序,这会增加延迟。
如果网络管理员有虚拟机,可支持增强网络功能,例如Single Root I/O虚拟化,他们可以使用它来提高性能。通过这个功能,数据包会绕过虚拟机管理程序,直接在NIC和VM之间流动。
配置工具和故障诊断技巧
当网络管理员处理网络可靠性和性能问题时,某些工具会派上用场。以下是有用的网络故障排除工具:
- Ipconfig和ifconfig。这些工具通常位于带有CLI的终端设备上,例如笔记本电脑和PC。当设置互联网访问并配置终端设备接口和默认网关,网络管理员就可以使用ipconfig和ifconfig来验证配置。
- Ping。这个CLI工具可以测试网络中数据包可访问性。
- Wireshark。这个数据包捕获工具,可以在数据包传输时捕获数据包。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
802.11标准:802.11ac、802.11ax、802.11be有何不同?
无线标准文档可长达数百页,并且包含各种技术细节。但其实我们可通过几个关键点来区分这些标准。 最新的Wi-Fi标 […]
-
零信任策略使网络面临横向威胁
很多公司忽视零信任安全的核心原则:假设网络已经受到攻击。 企业管理协会(EMA)的研究发现这个被忽视的零信任原 […]
-
思科推出集成AMD DPU的智能交换机以提高安全性
思科周二(2月11日)推出带有AMD Pensando数字处理单元(DPU)的交换机,该交换机在设备上运行安全 […]
-
云网络与云计算:有什么区别?
云计算和云网络是相关但不同的方法。云计算关注应用程序的运行方式,而云网络则涵盖如何管理和支持应用程序之间的连接 […]