📘 常见网络故障及排除🧰 一、网络故障处理结构化流程代码语言:bash复制📌 故障处理 9 步法:
1. 接收告警或用户报告(主动监控 / 被动感知)
2. 初步确认:复现问题、锁定受影响范围
3. 收集信息:拓扑、配置、日志、流量、链路状态等
4. 层次定位:结合OSI模型 + 对比分析
5. 工具诊断:ping, tracert, display, debug, Wireshark, Netflow, NQA等
6. 原因分析与验证:结合日志与业务操作匹配
7. 快速恢复:隔离问题、切换备链或替代路径
8. 根因确认与修复:配置修改、硬件替换、策略优化
9. 故障复盘:更新运维文档,提升防御手段🧱 二、排障方法汇总方法
描述与应用场景
分层法
基于OSI模型,逐层验证每个网络层是否出现异常
对比法
将故障设备与正常设备的配置/接口状态进行对比,快速发现差异
逐步替换法
替换网线、模块、设备、配置等,验证是否为物理或软故障
分段法
拆解网络结构,如:接入 → 汇聚 → 核心 → 出口,分别进行链路测试
回滚法
快速恢复关键配置状态,如启动备份配置、启用静态路由等应急策略
工具辅助
利用抓包工具(如Wireshark)、流量监控(Netstream)、链路检测(NQA/BFD)精准定位故障点
时间线分析法
将配置变更、业务变动、用户反馈、日志时间线对比,找出因果关系
🕸️ 三、网络环境中的常见故障类型场景
故障表现
常见原因与建议
SDN控制器失联
南北向流量中断
控制器主备配置异常、OpenFlow连接断链、心跳不通
IPv6主机无法访问公网
可访问内网但无法上网
缺省路由未配置、RA广播丢失、NAT64转换缺失
云服务器私网失联
Ping通但业务不通
云安全组限制、Overlay网络异常、VPC跨区域中断
MPLS VPN互访异常
用户A无法访问用户B
VPN实例未绑定接口、标签学习失败、PE未发布BGP-VPNv4路由
VRRP主备切换异常
主设备离线但备设备未接管
VRRP优先级低/未同步、心跳接口未UP、链路双DOWN但未触发抢占
DHCP分配异常
客户端自动IP获取失败
中继未配置、ACL拦截、地址池枯竭
🛠️ 四、诊断命令工具/命令
用途说明
display device
查看设备基本信息(型号、状态)
display interface brief
查看接口up/down状态与IP/MAC
display ip routing-table
查看路由学习情况及优先级
display acl all
检查ACL过滤是否阻断流量
display mac-address
查看是否学习到MAC、是否转发异常
display bgp/ospf peer
检查路由协议邻居是否建立、状态变化
display logbuffer
查看最近设备日志(硬件/协议故障/认证问题)
ping -a -s -c
带源地址、多包、多次ping测试网络连通性
nqa test-instance
主动探测链路状态(质量、丢包、延迟)
Wireshark抓包
分析ARP请求、TCP三次握手、DNS解析、认证失败等关键数据包
Netstream/telemetry
流量流向分析,定位异常流量源
🧩 五、思考题一台IPv6主机无法访问公网,排障思路是什么? 答:
检查地址获取方式(SLAAC / DHCPv6)是否成功是否收到RA通告,缺省路由是否存在NAT64/DNS64转换是否配置正确ACL是否放通IPv6出流量SDN环境下,交换机与控制器之间链路异常会造成哪些影响?如何恢复? 答:
控制器下发流表失败,业务路径中断使用链路检测(如BFD)触发链路切换或降级配置本地fallback流表或启用OpenFlow fail-mode列举Wireshark中常见的5种关键报文及其含义? 答:
ARP:用于MAC地址解析,常见冲突/欺骗DNS:域名解析是否正确响应TCP SYN:检查三次握手是否完成ICMP Echo:是否能ping通RST:表示连接被拒绝或主动断开