
首先确认阿里云WAF3.0的接入方式(回源或CNAME)是否正确,检查域名解析是否指向WAF提供的CNAME;其次在控制台查看该域名是否已开启防护并关联了正确的实例与防护域名。
在域名服务商处验证CNAME记录是否生效,使用dig/nslookup确认解析链路;若为回源接入,验证反向代理或负载均衡的配置是否将流量导入WAF实例。
登录控制台,查看该域名是否绑定了正确的防护策略和配置包,确认是否启用了全流量防护或仅启用部分模块(如仅开启网规或仅开启CC防护)。
打开访问日志与防护日志,搜索近期的请求记录,若日志中无对应请求,说明流量未通过WAF;若有请求但无拦截条目,检查规则白名单、风险阈值或自定义策略是否放行。
当出现误拦截时,第一时间要做到快速恢复业务,随后再定位误杀原因。优先开启日志审计与回溯,定位误杀请求的匹配规则。
在控制台中将疑似生效的自定义规则临时禁用或将策略切换为基础模式,若使用了WAF分组策略,可回退至上线前的策略版本以快速恢复。
使用防护日志抓取被拦请求的请求头、URI、参数与触发的规则ID;根据规则ID在策略管理中定位具体规则表达式,确认是否是正则/关键字过宽导致误判。
推荐在规则发布前做灰度测试,先在仅记录不拦截模式下观察一段流量,确认误杀率为零后再切换为拦截模式;对重要接口使用精准白名单或参数白名单。
HTTPS相关问题常见于证书未上传或回源协议冲突。首先确认阿里云WAF3.0上是否已正确上传并绑定了域名证书,且证书链完整无过期。
在WAF控制台的域名配置中查看SSL证书状态,确保证书类型(自有证书/托管证书)匹配并已生效,若为托管证书检查是否处于申请中。
确认回源是否为HTTPS,若回源为HTTPS需在WAF上配置回源证书校验(可选择不校验或上传回源证书),否则会出现WAF到源站握手失败导致页面异常。
使用浏览器开发者工具查看Console与Network,定位是否存在Mixed Content或证书错误,结合WAF访问日志确认请求在WAF处是否被正确转发或被拦截。
性能下降既可能因为防护策略过于严格导致额外处理,也可能是真正的攻击导致资源紧张。需同时从监控指标和策略配置两方面排查。
在WAF控制台与云监控中查看QPS、带宽、连接数和拦截率曲线,若拦截率明显上升且并发与流量激增,说明存在攻击,需要开启应急策略。
确认是否启用了过于严格的速率限流、会话限制或规则链导致正常请求被二次检测并延时,必要时放宽阈值或对重要IP做白名单处理。
通过抓取WAF实例的处理时长、回源响应时长和后端服务器CPU/连接状况,判断延迟是WAF处理开销还是后端响应慢,分别采取优化或扩容措施。
日志缺失会影响排查与溯源。首先确认WAF实例与日志服务(SLS或外部日志系统)的绑定与权限是否正常,确保日志写入通道未被禁用。
在WAF控制台检查访问日志、防护日志与告警日志是否开启,确认日志保留周期和输出方式(控制台展示、OSS、SLS、日志接入)配置正确。
如果日志输出到SLS或OSS,检查RAM角色权限是否包含写入权限,网络上是否存在访问被阻断(如VPC、白名单限制)导致日志无法正常投递。
确认是否存在日志采集延迟或采样策略(例如仅记录异常请求),必要时临时开启完整记录并扩大保留期限,随后分析完整日志定位潜在问题。