故障现象

组网拓扑如下所示,汇聚交换机(HJ_2)采用链路聚合技术连接核心交换机(HX_1),PC地址段网关配置在核心交换机上,各个PC属同一地址段连接汇聚交换机。

某日,运维人员发现终端PC中有的可以ping通网关、有的则不可以,不知该如何解决?

故障分析

1、终端PC无法ping通网关属于OSI参考模型的三层以下的问题,并未涉及路由;

2、针对链路层及物理层技术进行罗列分析并查看,如LLDP技术、STP生成树技术、环路检测技术、二层链路聚合技术和ARP技术等。

故障定位

第1步:通过查看汇聚交换机STP和环路检测,上行和下行链路未发现环路。另外,经测试,终端PC之间相互ping可通。

第2步:从第1步的查看、分析和测试,部分终端PC无法ping通网关,可定位于汇聚交换机上行链路和核心交换机的下行链路。

第3步:通过LLDP技术查看汇聚交换机与核心交换机之间物理连接链路,如下所示。然而当查看交换机的链路聚合配置时,发现核心交换机有个物理并未加入到链路聚合组中,如下图所示。

第4步:更新核心交换机G1/0/3接口的配置,各个终端PC均能ping通网关IP,问题解决。经向运维人员质询求证,核心交换机物理链路,插接错误。

脑补之链路聚合技术

脑补1:为何会出现上述问题呢?主要根因在于二层链路聚合技术中的“load-sharing”,即链路负载方式

以华三交换机为例,默认情况下,二层链路聚合链路负载方式如下所示:

dis link-aggregation load-sharing mode

Link-aggregation load-sharing mode:

Layer 2 traffic: packet type-based sharing

Layer 3 traffic: packet type-based sharing

通过汇聚交换机的链路负载计算,部分终端PC可以ping通网关,该ping包由汇聚交换机从G1/0/2转发到核心交换机G1/0/2(Trunk接口并放通vlan100);部分终端PC不可ping通网关,该ping包由汇聚交换机从G1/0/1转发到核心交换机G1/0/3(无配置),可通过抓包分析验证。

脑补2:链路聚合技术种类

静态链路聚合,可适用于不同厂商设备之间或同厂商设备之间互联使用;

动态链路聚合,可适用于同厂商设备之间互联使用,一般不用于不同厂商设备之间互联使用;

二层链路聚合,工作于OSI参考模型的链路层,聚合接口属于二层接口;

三层链路聚合,工作于OSI参考模型的网络层,聚合接口可配置IP地址;

脑补3:二层链路聚合技术配置实现逻辑

第1步:创建二层链路聚合组;

[HX_1]interface Bridge-Aggregation 10

[HX_1-Bridge-Aggregation10]

第2步:物理接口加入到链路聚合组中;

[HX_1]interface range GigabitEthernet 1/0/23 to GigabitEthernet 1/0/24

[HX_1-if-range]port link-aggregation group 10

第3步:配置链路聚合组;

[HX_1]interface Bridge-Aggregation 10

[HX_1-Bridge-Aggregation10]port access vlan 100

Configuring GigabitEthernet1/0/23 done.

Configuring GigabitEthernet1/0/24 done.

[HX_1-Bridge-Aggregation10]

脑补4:链路聚合技术的链路负载方式

[HX_1]link-aggregation global load-sharing mode ?

destination-ip Destination IP address

destination-mac Destination MAC address

destination-port Destination port

ingress-port Ingress port

source-ip Source IP address

source-mac Source MAC address

source-port Source port

总结

网络故障处理可按照OSI参考模型的分层思路,分析判断网络故障;可采用分段测试、对比分析测试的手段,定位故障点,从而最终解决问题。

本期文章就分享这么多,不足之处,欢迎各位小伙伴留言指正。