1
概述与准备检查
1) 确认故障范围:单机/全站/部分用户受影响;
2) 确认测点位置:从大陆、香港与其他海外点同时测试;
3) 确认服务端基本信息:提供商、机房、带宽类型(共享/独享);
4) 采集初始指标:CPU、内存、磁盘 I/O、网卡流量;
5) 记录基线:当前平均延迟/丢包/带宽峰值作为对比基线。
2
网络连通性快速诊断
1) ping:测延迟与抖动(示例:从上海到香港 avg=28ms, jitter=3ms);
2) traceroute 或 mtr:定位高延迟/丢包跳点;
3) tcping 或 curl -I:检测 TCP 三次握手与 HTTP 响应时间;
4) 检查丢包:>1% 要重视,>5% 为严重问题;
5) 验证 MTU 与路径 MTU,避免分片导致性能下降。
3
带宽与 I/O 瓶颈测试(含示例表格)
1) iperf3 测试上下行吞吐(示例值见表);
2) dd 或 fio 测试磁盘顺/随机读写 IOPS 与延迟;
3) 查看 vnstat 或 iftop 实时流量,确认是否被带宽占满;
4) 检查网络队列(txqueuelen)与网卡中断绑定;
5) 根据结果决定是否要升级带宽或更换存储类型(HDD->SSD)。
| 测试项目 | 示例数值 | 说明 |
| iperf3 TCP 下行 | 85 Mbps | 峰值接近100Mbps共享口 |
| ping(上海->HK) | 28 ms | 正常值 |
| 磁盘 4K 随机写 | 1500 IOPS | SSD 中等水平 |
4
应用层(Web/数据库)诊断要点
1) 检查 TTFB:高于500ms 需找后端瓶颈;
2) 查看 Nginx/Apache 并发连接与慢日志;
3) 检查 PHP-FPM 或应用线程池利用率;
4) 数据库慢查询、锁等待、连接数溢出需优化索引与连接池;
5) 用 ab/jmeter 对比本地直连与 CDN 加速后的响应差异。
5
DNS、域名与 CDN 优化策略
1) 确保 DNS 解析在香港近源或使用 Anycast;
2) TTL 不宜过低,适当缓存减轻解析压力;
3) 对静态资源使用 CDN,减小源站带宽与延迟;
4) CDN 配置智能路由,优先香港/中国节点;
5) 检查 HTTPS 握手时间,启用 TLS 1.3 可减少握手时延。
6
DDoS 与流量异常处理
1) 监控突发流量:异常峰值秒级上升需启用防护;
2) 使用云端清洗或 BGP 黑洞策略做流量吸收;
3) 设置 ACL、rate-limit、连接数上限与 SYN cookies;
4) 对应用层攻击(HTTP flood)启用 WAF 与行为验证码;
5) 真实案例:某客户遭 800Mbps UDP 攻击,经云清洗降至 40-60Mbps,服务恢复。
7
系统与网络参数常用优化命令示例
1) TCP 参数:net.ipv4.tcp_fin_timeout=30; net.core.somaxconn=1024;
2) 调整拥塞控制:sysctl -w net.ipv4.tcp_congestion_control=bbr(示例);
3) 打开 conntrack 及调整哈希表大小以支持大并发;
4) 关闭不必要的服务,减少上下文切换与内存竞争;
5) Nginx 优化:keepalive_timeout、worker_connections、sendfile on 等。
8
真实案例复盘与建议
1) 案例描述:客户 A 香港 VPS(配置:2 vCPU、4GB RAM、80GB SSD、100Mbps 共享口)遇到页面加载慢(TTFB 2s);
2) 排查结果:mtr 显示上游交换机在高峰期丢包 6%,iperf3 下行稳定 90Mbps;
3) 处理措施:更换到独享带宽线路、启用 CDN、优化数据库索引;
4) 结果:TTFB 从 2s 降到 120-250ms,页面加载总体提升 60%;
5) 建议:建立监控告警(延迟/丢包/流量阈值),定期做压力测试与配置复审。
来源:香港vps速度太慢时的快速诊断流程与常用优化手段整理