mongodb主从数据不同步怎么解决?

首先检查副本集状态,确认网络与认证配置正常,必要时扩容oplog或强制重新同步。

当MongoDB主从节点数据不同步时,通常出现在副本集架构中。虽然传统“主从复制”已被副本集(Replica Set)取代,但大家仍习惯称主节点为Primary,从节点为Secondary。数据不同步可能由网络中断、节点宕机、oplog大小不足或配置错误引起。以下是排查和解决的常见方法。

检查副本集状态

连接到Secondary节点,运行以下命令查看同步状态:

rs.status()

重点关注以下字段:

  • stateStr:应为 "SECONDARY" 或 "PRIMARY"
  • optime:与主节点的oplog时间是否接近
  • health:值为1表示正常,0表示不可达或异常
  • errmsg:如果有错误会在这里显示

如果节点处于 STARTUPRECOVERINGROLLBACK 状态,说明正在尝试恢复同步。

确认Oplog是否足够大

MongoDB通过oplog(操作日志)实现复制。如果主节点写入量大而oplog太小,Secondary可能因无法追上而落后太多,最终需要全量同步。

查看oplog大小和时间跨度:

use local
db.oplog.rs.stats()

关注 sizemaxSize 字段。建议oplog保留至少24小时的操作记录。若过小,可手动扩容oplog。

强制重新同步(Resync)

当Secondary数据严重滞后或出现不一致,最彻底的解决方式是清除其数据目录并触发全量同步:

  • 停止Secondary mongod 实例
  • 删除数据目录下的所有文件(如 /data/db/*)
  • 重启mongod服务

启动后,MongoDB会自动检测到无数据,向Primary请求完整数据快照,然后重放oplog完成同步。

注意:确保Primary节点数据完整且oplog未被覆盖,否则会导致同步失败。

检查网络与认证配置

网络不通或认证失败也会导致无法同步:

  • 确认Primary和Secondary之间端口(默认27017)可通
  • 检查防火墙或安全组设置
  • 验证副本集成员间使用相同的 keyFile 或认证机制
  • 查看mongod日志(logPath指定的文件),搜索 "replSet error" 或 "connection refused"

基本上就这些。多数不同步问题通过检查状态、清理数据目录并重新同步即可解决。关键是保证oplog不被覆盖、网络通畅、权限正确。MongoDB的复制机制很健壮,只要底层稳定,同步会自动恢复。