交换机故障的一般分类及排除办法

运维 网络运维
有些交换机故障我们很难被发现,需要一定的经验积累。如果不能确保用户的配置有问题,请先恢复出厂默认配置,然后再一步一步地配置。最好在配置之前,先阅读说明书,这也是网管所要养成的习惯之一。

交换机故障还是比较常用的,于是我研究了一下交换机故障的一般分类及排除办法,在这里拿出来和大家分享一下,希望对大家有用。交换机的软件故障是指系统及其配置上的交换机故障,它可以分为以下几类。
 
(1)系统错误:
 
交换机系统是硬件和软件的结合体。在交换机内部有一个可刷新的只读存储器,它保存的是这台交换机所必需的软件系统。这类错误也和我们常见的Windows、Linux一样,由于当时设计的原因,存在一些漏洞,在条件合适时,会导致交换机满载、丢包、错包等情况的发生。所以交换机系统提供了诸如Web、TFTP等方式来下载并更新系统。当然在升级系统时,也有可能发生错误。对于此类问题,我们需要养成经常浏览设备厂商网站的习惯,如果有新的系统推出或者新的补丁,请及时更新。
 
(2)配置不当:
 
初学者对交换机不熟悉,或者由于各种交换机配置不一样,管理员往往在配置交换机时会出现配置错误。比如VLAN 划分不正确导致网络不通,端口被错误地关闭,交换机和网卡的模式配置不匹配等原因。这类交换机故障有时很难发现,需要一定的经验积累。如果不能确保用户的配置有问题,请先恢复出厂默认配置,然后再一步一步地配置。最好在配置之前,先阅读说明书,这也是网管所要养成的习惯之一。每台交换机都有详细的安装手册、用户手册,深入到每类模块都有详细的讲解。由于很多交换机的手册是用英文编写的,所以英文不好的用户可以向供应商的工程师咨询后再做具体配置。
 
(3)密码丢失:
 
这可能是每个管理员都曾经经历过的。一旦忘记密码,都可以通过一定的操作步骤来恢复或者重置系统密码。有的则比较简单,在交换机上按下一个按钮就可以了。而有的则需要通过一定的操作步骤才能解决。此类情况一般在人为遗忘或者交换机发生故障后导致数据丢失,才会发生。
 
(4)外部因素:
 
由于病毒或者黑客攻击等情况的存在,有可能某台主机向所连接的端口发送大量不符合封装规则的数据包,造成交换机处理器过分繁忙,致使数据包来不及转发,进而导致缓冲区溢出产生丢包现象。还有一种情况就是广播风暴,它不仅会占用大量的网络带宽,而且还将占用大量的CPU处理时间。网络如果长时间被大量广播数据包所占用,正常的点对通信就无法正常进行,网络速度就会变慢或者瘫痪。
 
一块网卡或者一个端口发生故障,都有可能引发广播风暴。由于交换机只能分割冲突域,而不能分割广播域(在没有划分VLAN 的情况下),所以当广播包的数量占到通信总量的30%时,网络的传输效率就会明显下降。
 
总的来说软件故障应该比硬件故障较难查找,解决问题时,可能不需要花费过多的金钱,而需要较多的时间。最好在平时的工作中养成记录日志的习惯。每当发生故障时,及时做好故障现象记录、故障分析过程、故障解决方案、故障归类总结等工作,以积累自己的经验。比如有时在进行配置时,由于种种原因,当时没有对网络产生影响或者没有发现问题,但也许几天以后问题就会逐渐显现出来。如果有日志记录,就可以联想到是否前几天的配置有错误。由于很多时候都会忽略这一点,以为是在其他方面出现问题,当走了许多弯路之后,才找到问题所在。所以说记录日志及维护信息是非常必要的。

交换机故障的一般排障步骤: 
 
交换机的故障多种多样,不同的故障有不同的表现形式。故障分析时要通过各种现象灵活运用排除方法(如排除发、对比法、替换法),找出故障所在,并及时排除。
 
(1)排除法:
 
当我们面对故障现象并分析问题时,无意中就已经学会使用排除法来确定发生故障的方向了。这种方法是指依据所观察到的故障现象,尽可能全面地列举出所有可能发生的故障,然后逐个分析、排除。在排除时要遵循有简到繁的原则,提高效率。使用这种方法可以应付各种各样的故障,但维护人员需要有较强的逻辑思维,对交换机知识有全面深入的了解。
 
(2)对比法:
 
所谓对比法,就是利用现有的、相同型号的且能够正常运行的交换机作为参考对象,和故障交换机之间进行对比,从而找出故障点。这种方法简单有效,尤其是系统配置上的故障,只要简单地对比一下就能找出配置的不同点,但是有时要找一台型号相同、配置相同的交换机也不是一件容易的事。
 
(3)替换法:
 
这是我们最常用的方法,也是在维修电脑中使用频率较高的方法。替换法是指使用正常的交换机部件来替换可能有故障的部件,从而找出故障点的方法。它主要用于硬件故障的诊断,但需要注意的是,替换的部件必须是相同品牌、相同型号的同类交换机才行。当然为了使排障工作有章可循,我们可以在故障分析时,按照以下的原则来分析。
 
1、由远到近
 
端口模块—>水平线缆—>跳线—>交换机这样一条路线,逐个检查,先排除远端故障的可能。
 
2、由外而内
 
如果交换机存在故障,我们可以先从外部的各种指示灯上辨别,然后根据交换机故障指示,再来检查内部的相应部件是否存在问题。比如POWER LED为绿灯表示电源供应正常,熄灭表示没有电源供应;LINK LEDs为黄色表示现在该连接工作在10Mb/s,绿色表示为100 Mb/s,熄灭表示没有连接,闪烁表示端口被管理员手动关闭;RDP LED表示冗余电源;MGMT LED表示管理员模块。无论能否从外面的出故障所在,都必须登录交换机以确定具体的故障所在,并进行相应的排障措施。
 
3、由软到硬
 
发生故障,谁都不想动不动就那螺丝刀去先拆了交换机再说,所以在检查时,总是先从系统配置或系统软件上着手进行排查。如果软件上不能解决问题,那就是硬件有问题了。比如某端口不好用,那我们可以先检查用户所连接的端口是否不在相应的VLAN中,或者该端口是否被其他的管理员关闭,或者配置上的其他原因。如果排除了系统和配置上的各种可能,那就可以怀疑到真正的问题所在——硬件故障上。
 
4、先易后难
 
在遇到故障分析较复杂时,必须先从简单操作或配置来着手排除。这样可以加快故障排除的速度,提高效率。 
 
总结: 
 
由于交换机故障现象多种多样,没有固定的排除步骤,而有的故障往往具有明确的方向性,一眼就能识别得出。所以只能根据具体情况具体分析了,当然不管是什么样的故障对于一个新上任的网络管理员来说都是困难的事,所以如果你希望能够成为交换机故障的排除高手,就一定要在日常工作中积累经验,每弄好一个问题都用心的去回顾问题根源以及解决方法。这样才能不断的提高自己,更好的完成网络管理的重任。

责任编辑:王晓东 来源: NET130
相关推荐

2009-12-17 10:40:58

交换机故障分类

2010-01-05 11:24:34

2013-05-22 14:25:17

2010-03-11 16:45:46

全光交换机

2010-01-06 08:56:52

交换机故障

2010-03-12 10:14:52

无线交换机

2010-01-06 09:37:11

交换机故障排除

2010-01-06 09:56:22

2010-03-10 14:04:53

交换机故障

2010-01-06 17:26:02

交换机故障

2010-01-04 17:07:01

排除交换机故障

2010-01-06 10:27:37

2011-07-27 10:07:34

程控交换机

2010-01-04 17:07:03

排除交换机故障

2013-01-23 09:33:29

交换机设备故障

2013-05-23 09:22:10

网吧网络交换机故障

2010-04-01 18:22:36

无线交换机故障

2011-12-02 10:55:25

交换机

2010-01-05 10:56:53

2010-10-08 09:18:13

VLAN无线上网交换机
点赞
收藏

51CTO技术栈公众号