李志涛

导航

caseStudy-20181216-Kafka(xxx)集群故障&解决办法

1.问题描述 2018-12-16 23:53起,因10.120.14.1节点出现问题,已经无法ssh上去,导致xxx lag延迟上升,在17日凌晨1:43掉线,落在该节点但leader partition无法转移,凌晨3点磁盘故障,恢复后集群大面积不可用,直至凌晨7:30以后集群逐渐恢复起止时间:

posted on 2020-04-06 15:32  李志涛  阅读(487)  评论(0编辑  收藏  举报