内部原理

# 内部原理

# 节点类型

# Stat 结构体

（1）czxid - 创建节点的事务 zxid

每次修改 ZooKeeper 状态都会收到一个 zxid 形式的时间戳，也就是 ZooKeeper 事务 ID。

事务 ID 是 ZooKeeper 中所有修改总的次序。每个修改都有唯一的 zxid，如果 zxid1 小于 zxid2，那么 zxid1 在 zxid2 之前发生。

（2）ctime - znode 被创建的毫秒数 (从 1970 年开始)

（3）mzxid - znode 最后更新的事务 zxid

（4）mtime - znode 最后修改的毫秒数 (从 1970 年开始)

（5）pZxid-znode 最后更新的子节点 zxid

（6）cversion - znode 子节点变化号，znode 子节点修改次数

（7）dataversion - znode 数据变化号

（8）aclVersion - znode 访问控制列表的变化号

（9）ephemeralOwner- 如果是临时节点，这个是 znode 拥有者的 session id。如果不是临时节点则是 0。

（10）dataLength- znode 的数据长度

（11）numChildren - znode 子节点数量

# 监听器原理

# 选举机制

（1）半数机制：集群中半数以上机器存活，集群可用。所以 Zookeeper 适合安装奇数台服务器。

（2）Zookeeper 虽然在配置文件中并没有指定 Master 和 Slave。但是，Zookeeper 工作时，是有一个节点为 Leader，其他则为 Follower，Leader 是通过内部的选举机制临时产生的。

（3）选举流程

( 1）服务器 1 启动，发起一次选举。服务器 1 投自己一票。此时服务器 1 票数一票，不够半数以上（3 票），选举无法完成，服务器 1 状态保持为 LOOKING；

（2）服务器 2 启动，再发起一次选举。服务器 1 和 2 分别投自己一票并交换选票信息：此时服务器 1 发现服务器 2 的 ID 比自己目前投票推举的（服务器 1）大，更改选票为推举服务器 2。此时服务器 1 票数 0 票，服务器 2 票数 2 票，没有半数以上结果，选举无法完成，服务器 1，2 状态保持 LOOKING

（3）服务器 3 启动，发起一次选举。此时服务器 1 和 2 都会更改选票为服务器 3。此次投票结果：服务器 1 为 0 票，服务器 2 为 0 票，服务器 3 为 3 票。此时服务器 3 的票数已经超过半数，服务器 3 当选 Leader。服务器 1，2 更改状态为 FOLLOWING，服务器 3 更改状态为 LEADING；

（4）服务器 4 启动，发起一次选举。此时服务器 1，2，3 已经不是 LOOKING 状态，不会更改选票信息。交换选票信息结果：服务器 3 为 3 票，服务器 4 为 1 票。此时服务器 4 服从多数，更改选票信息为服务器 3，并更改状态为 FOLLOWING；

（5）服务器 5 启动，同 4 一样当小弟。

# 写数据流程

客户向服务端发起请求
请求转发给 Leader
Leader 将写请求广播给各个 server (即 Follower) 进行投票
投票超半数 则进行 Leader 会向各个 server 发送提交信息各个 server 收到写请求放入队列中写入数据
1. 如果某个 server 投不同意而超过半数投同意票则此 server 会进行重启并向 leader 重新同步数据
2. 如果 server 的 czxid 比 leader 当前写数据的 czxid 大则此 server 会投不同意票反之投同意票
server 会进一步通知客户端写数据成功

编辑

上次更新: 2023/12/06, 01:31:48

← 客户端命令行操作 Api→