@zhangyy
2021-07-23T15:02:29.000000Z
字数 1484
阅读 809
greenplum系列
模拟master standby 坏掉,删除目录,重启rm -rf /greenplum/gpdata/master/*
正常情况gpstate -f

rm -rf /greeplum/gpdata/master/*reboot


主节点:gpinitstandby -r 清除standby 节点

添加一个备库gpinitstandby -s node02.flyfish.cn



模拟master坏掉,删除目录,重启rm -rf /greenplum/gpdata/master/*reboot就standby 节点故障:在master节点上面执行:删除故障的standby节点gpinitstandby -r -a重新同步standby节点:gpinitstandby -s node02.flyfish.cn
1. 先切换备库作为主库激活:standbygpactivatestandby -d /greenplum/gpdata/master/gpseg-1gpstate -f

psql -c "select * from gp_segment_configuration order by content asc,dbid;"

然后在增加一个standbygpinitstandby -s node01.flyfish.cn这样(node01.flyfish.cn) master 就成为standby了(node02.flyfish.cn) 就成为master

主机切回node02.flyfish.cn 关闭主库:gpstop -m -a

node01.flyfish.cn 成为主库:gpactivatestandby -d /greenplum/gpdata/master/gpseg-1

node02.flyfish.cn:rm -rf /greenplum/gpdata/master/gpseg-1reboot

node01.flyfish.cn执行 加添node02.flyfish.cn 成为备库gpinitstandby -a -s node02.flyfish.cn




模拟segment 主机故障集群由于负载均衡高,坏cpu,坏内存,坏硬盘---比如: node03.flyfish.cn segment 主坏掉新买一台服务器:安装系统,配置,配置SSH 无密钥认证,ip一样,主机名一样,跟增加主机节点一样。---rm -rf /greenplum/gpdata/primary/*rm -rf /greenlum/gpdata/mirror/*

gpstate -fnode03.flyfish.cn 挂掉了


在node01.flyfish.cn 上面恢复gprecoverseg -o ./recover

gprecoverseg -i ./recover 修复一下gprecoverseg -i ./recover -F 全部修复




一个段损坏cd /greenplum/gpdata/mirror/gpseg3rm -rf pg_tblspc/杀掉一个这个段的进程kill -9 93213

进行恢复gprecoverseg -o ./recover1cat ./recover1

恢复:gprecoverseg -i recover1 -F

gprecoverseg -r从新平衡segment的


重启集群:gpstop -r -a
