背景:
1、代码未经过改动,未发布新版本,运行环境未有变动
2、告警很突然,持续时间长
3、告警次数大
排查:
1、根据上述数据排序ng日志,发现该条(以时间戳为标准)日志丢失,推测数据丢失
2、网络问题云服务抓包,发现该告警outIP建链大量失败
3、根据接口https://api.weixin.qq.com/cgi-bin/callback/check?access_token=ACCESS_TOKEN 检测网络----正常丢包0%
4、根据接口查询回调所有ip,发现有些ip能ping通 有些ip不能ping通 告警的ip就属于不能ping通的其中一个
5、自我检测,发现我们服务器未设置任何拦截ip的策略,traceroute ping的通和ping不通ip发现都网络都能出服务器到公网上
推测:微信服务器集群中某些ip网络问题,是否做了ip限制
@微信公众号 希望能帮忙定位一下问题
如果是临时偶发的就再观测一下,官方也有抽风的可能性
有的时候一个故障弄半天,啥也没搞自己就好了