频 道 直 达 - 新闻 - 读书 - 培训 - 教程 - 前沿 - 组网 - 系统应用 - 安全 - 编程 - 存储 - 操作系统 - 数据库 - 服务器 - 专题 - 产品 - 案例库 - 技术圈 - 博客 - BBS
51CTO.COM_中国领先的IT技术网站
找资料:

核心层交换机更换后业务为何瘫痪

作者: 佚名 出处:chinaitlab 2008-04-24 17:35    砖    好    评论   进入论坛
阅读提示:对于整天与计算机网络打交道的网络管理员来说,遭遇网络故障几乎成为了家常便饭,而大多部分网络故障现象都局限在无法上网、频繁掉线或者是访问速度缓慢等。

对于整天与计算机网络打交道的网络管理员来说,遭遇网络故障几乎成为了家常便饭,而大多部分网络故障现象都局限在无法上网、频繁掉线或者是访问速度缓慢等。其实引起网络故障的原因可谓是繁多,既有人为操作因素引起的,也有网络设备自身状态引起的,还有可能是外界干扰引起的;但是在实际解决网络故障的过程中,笔者们有时会发现在排除了上面列出的各种可能因素后,网络故障仍然无法消除。下面的一则网络故障为核心层交换机主控板更换后,设备运行正常,但是业务并没有真正的恢复,竟然是上端设备端口资源没有释放所引起。相信各位看完下面的故障排除过程之后,一定会有新的收获。

故障现象

多个分支机构的局域网是通过租用当地运营商的10M光纤通道直接访问本地总部企业网,所有本地分支机构的网络汇聚到核心层交换,核心层交换直接连到路由器。其他的交换机负责各个网络业务的接入,这样网络结构比较简单明了,实际运行的状态也是比较稳定的。 前几天,网络突然出现大面积瘫痪故障,并导致企业业务无法正常运转。根据网络拓扑及出现的故障现象,可以迅速地定位到核心层交换设备出现了问题。到了现场的后,发现的主控板出现了告警,设备复位,告警并没有消除,可以判断为主控板损坏,更换新的主控板,设备运行正常,所有的二层透传业务恢复,但是所有IP业务没有恢复。

故障排查分析

排查一、物理故障还是逻辑故障?

故障的根源是核心层交换机的主控板出现了问题,这样网络故障的性质为物理故障。难道新更换的主控板有问题?但是设备运行正常,又没有告警信息。如:show card ,show cpu等,从运行状态上看,硬件没有问题。难道更换设备后,数据丢失了吗?察看相关的数据,发现并没有丢失,但是IP业务还是不能够恢复?可是部分透传业务又没有问题。究竟那里出现了问题呢?

排查二、DNS服务出了问题?

经过检查,笔者发现,虽然业务不能使用,但所有的路由信息都是正常的,PING所有的网元信息也都是正常的。难道是DNS服务出了问题?

所谓DNS,即域名服务器,它把域名转换为计算机能够识别的IP地址。如网站对应的IP是219.218.100.100。如果DNS服务器出错,则无法进行域名解释,自然也就不能上网了。有时候则是路由器的问题,无法与ISP的DNS服务连接,这时可把路由器关闭一会再开或是重新设置路由器即可。还有可能是网卡无法自动搜寻到DNS的服务器地址,可以尝试用指定的DNS服务器地址。进入“控制面板→网络和拨号连接”,双击“本地连接→属性→TCP/IP协议”,在弹出的对话框中选择“使用下面的DNS服务器地址”,然后填写相应的DNS服务器IP地址。经过核实后,DNS也没有问题。

排查三、是中ARP病毒还是有流量攻击?

故障发生前期,个别分支机构经常有人反映说上网时经常出现丢包现象,想到最近局域网中经常出现的ARP地址欺骗病毒,笔者就向所有相关的网络技术人员介绍了一下排查各自局域网,是否感染了ARP地址欺骗病毒,希望通过找到并解决感染ARP地址欺骗病毒的机器来解决IP业务不能恢复的问题,并没有查出结果。难道设备更换后,所有的路由表丢失了吗?把前几天的数据备份重新导入后,故障现象的依然存在。为了更快的恢复业务,咨询了设备厂家的技术支持,把所有的故障现象反馈给技术工程师,并查看了所有的告警及系统日志,并没有发现可疑的问题。最后得到的结果是:该设备运行正常,没有病毒的攻击、流量异常等现象。

故障解决

路是通的,说明该设备没有问题。网元是通的,DNS又没有问题,但是业务不能够恢复。在检查IP ARP信息时,发现所有的MAC地址与IP地址都在地址表。看见笔者使用的IP地址及MAC地址也在表中(如图)。但笔者的计算机并没有开!难道核心层与路由器的端口出现了问题?尝试着,把端口关闭后,再重新启用。发现笔者使用IP地址后,没有MAC地址。所有的IP业务全部恢复。

故障总结

虽然故障已经被解决了,但让笔者感到疑惑不解的是:为什么重新启动端口,业务就能够正常。而出现的故障点不是在路由器上,而是在核心层交换机上。不重新启动端口,测试的现象的都是正常的。后来咨询了相关的技术人员,故障发生前,数据的流量很大,故障发生时,很多的数据包不能正常转发,端口就会出现假死现象,传输的数据流量很小。关闭后,把多余的数据遗弃掉,重新启动,传输正常的数据信息。

总结上面的故障排除过程发现,出现网络故障应该从正常网络中去检测上段部分网络运行情况,来判断网络上段网络是否正常,然后,再检查下段网络,使用PING命令测试,进行针对性排查。即使发生的故障点恢复,并不代表业务的恢复,思考问题不能局限于局部信息,应该从全局思考。并结合具体的网络工作环境,说不定发现故障就在疏忽那一瞬间,要认真观察对网络有影响因素,可以避免少走一些弯路。作为一名网络管理员,除了日常网络故障的处理外,还会不时碰到自己知识范围以外的东西,但只要引起足够的重视,总会找到解决问题的办法。

【相关文章】

【责任编辑:王健楠 TEL:(010)68476606】

专题
交换机故障解决指南
交换机的安全配置与安全漫谈
交换机的选购
常用交换机典型配置
思科全球CEO钱伯斯第七次访华
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 领 先 的 IT 技 术 网 站 ·
技 术 成 就 梦 想
订阅技术快讯
电子杂志下载
名称:SQL Server数据库管理精品黄皮书
简介:书中文章经过精挑细选,便于用户能根据自己的实际工作和学习,快速在本书寻找到相关资料。内容涵盖了SQL Server的安装与升级、语句查询、数据备份和恢复、自动化任务、数据同步、数据字典、安全和预防、性能和优化、集群等各方面应用信息,以及DBA管理人员在数据库管理工作中
名称:2007路由技术大全
简介:《2007路由技术大全》由51CTO.com网站特别策划制作,该书包括路由器技术、路由器产品、路由器配置、安全设置、路由器故障处理、路由器密码恢复,以及广大网友在实践使用中的心得经验和技巧文章,内容注重实用性,适用于初学者入门,也适合多年从业者提高,是一本实践和理论完
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。
Linux——从菜鸟到高手
Linux——从菜鸟..
数据恢复指南
数据恢复指南
交换机故障解决指南
交换机故障解决指..
· 交换机故障解决指南
· OSPF路由协议专栏
· 勇闯IT培训黑色围城
· 见证中国网络安全二十年
· 技术人求职简历完备手册
· 华为员工自杀频频拷问..
· 视频访谈:网管员如何踏..
· 首届中国IT工程师生态..
· 思科全球CEO钱伯斯第七..
· 北漂技术人90天求职纪实
· 2007年互联网大会
· 龙芯要做中国的“奔腾”
· IPv6协议--拓展网络无..
· 国际文档格式标准开战
· 微软出价446亿美元收购..
· 贝恩资本携手华为22亿..
ARP攻击防范与解决方案
ARP攻击防范与解..
iSCSI应用与发展
iSCSI应用与发展
SQL Server 2008/2005全解
SQL Server 2008/..
· SQL Server 2008/2005..
· SOA 面向服务架构
· SQL Server 2008/2005..
· iSCSI应用与发展
· RAID——磁盘阵列基础
· 中间件应用技术专题
· SQL Server入门到精通
· 国际文档格式标准开战
· 路由器设置与口令恢复
· Linux防火墙
· 打造安全服务器
· SOA 面向服务架构
· PHP开发应用手册
· ADSL应用面面俱到
· 入侵防护系统(IPS)初探
· 数据恢复指南
ARP攻击防范与解决方案
ARP攻击防范与解..
SQL Server 2008/2005全解
SQL Server 2008/..
iSCSI应用与发展
iSCSI应用与发展
· iSCSI应用与发展
· 中间件应用技术专题
· SQL Server入门到精通
· SQL Server 2008/2005..
· SOA 面向服务架构
· iSCSI应用与发展
· RAID——磁盘阵列基础
· 数据恢复指南
· 路由器设置与口令恢复
· SOA 面向服务架构
· 了解统一威胁管理(UTM)..
· ADSL应用面面俱到
· ADSL应用面面俱到
· PHP开发应用手册
· 中间件应用技术专题
· 交换机故障解决指南