0%

初探Eureka与Zookeeper

服务注册中心,给客户端提供可供调用的服务列表,客户端在进行远程服务调用时,根据服务列表然后选择服务提供方的服务地址进行服务调用。服务注册中心在分布式系统中大量应用,是分布式系统中不可或缺的组件,例如rocketmq的name server,hdfs中的namenode,dubbo中的zk注册中心,spring cloud中的服务注册中心eureka。 在spring cloud中,除了可以使用eureka作为注册中心外,还可以通过配置的方式使用zookeeper作为注册中心。既然这样,我们该如何选择注册中心的实现呢?

CAP定理

又被称作布鲁尔定理(Eric Brewer)它指出对于一个分布式计算系统来说,不可能同时满足以下三点:

  1. 强一致性(Consistency):系统在执行某项操作后数据状态仍然处于一致,例如在分布式系统中,更新操作执行成功后所有的用户都应该读取到最新的值,这样的系统被认为具有强一致性。
  2. 可用性(Availability):每一个操作总是能够在一定的时间内返回结果
  3. 分区容错性(Partition tolerance):单个节点故障不应导致整个系统崩溃,也就是说尽管网络在节点之间丢弃(或延迟)任意数量的消息,但是系统继续操作。

根据CAP原理将数据库分成了满足CA原则、满足CP原则和满足AP原则三大类

  1. CA:单点集群,满足一致性,可用性,通常在可扩展性上不太强大,比如RDB。
  2. CP:满足一致性和分区容错性,通常性能不是特别高,如分布式数据库。
  3. AP:满足可用性和分区容错性,通常可能对一致性要求低一些,如大多数的NoSQL。

BASE(Basically Available,Soft-state,Eventual consistency)

eBay的架构师Dan Pritchett源于对大规模分布式系统的实践总结,在ACM上发表文章提出BASE理论,BASE理论是对CAP理论的延伸,核心思想是即使无法做到强一致性(Strong Consistency,CAP的一致性就是强一致性),但应用可以采用适合的方式达到最终一致性(Eventual Consitency)。

  1. 基本可用(Basically Available):系统能够基本运行并一直提供服务。
  2. 软状态(Soft-state):系统不要求一直保持强一致状态。
  3. 最终一致性(Eventual consistency):系统需要在某一时刻后达到一致性要求。

Zookeeper保证CP

  • 当向注册中心查询服务列表时,我们可以容忍注册中心返回的是几分钟以前的注册信息,但不能接受服务直接down掉不可用。也就是说,服务注册功能对可用性的要求要高于一致性。但是zk会出现这样一种情况,当master节点因为网络故障与其他节点失去联系时,剩余节点会重新进行leader选举。问题在于,选举leader的时间太长,30 ~ 120s, 且选举期间整个zk集群都是不可用的,这就导致在选举期间注册服务瘫痪。在云部署的环境下,因网络问题使得zk集群失去master节点是较大概率会发生的事,虽然服务能够最终恢复,但是漫长的选举时间导致的注册长期不可用是不能容忍的。

Eureka保证AP

  • Eureka各个节点都是平等的,几个节点挂掉不会影响正常节点的工作,剩余的节点依然可以提供注册和查询服务。而Eureka的客户端在向某个Eureka注册或如果发现连接失败,则会自动切换至其它节点,只要有一台Eureka还在,就能保证注册服务可用(保证可用性),只不过查到的信息可能不是最新的(不保证强一致性)。除此之外,Eureka还有一种自我保护机制,如果在15分钟内超过85%的节点都没有正常的心跳,那么Eureka就认为客户端与注册中心出现了网络故障,此时会出现以下几种情况:

    1. Eureka不再从注册列表中移除因为长时间没收到心跳而应该过期的服务
    2. Eureka仍然能够接受新服务的注册和查询请求,但是不会被同步到其它节点上(即保证当前节点依然可用)
    3. 当网络稳定时,当前实例新的注册信息会被同步到其它节点中
  • 因此, Eureka可以很好的应对因网络故障导致部分节点失去联系的情况,而不会像zookeeper那样使整个注册服务瘫痪。

Eureka注册发现流程

  1. 启动Eureka Server。
  2. Eureka Client服务提供者启动时候将服务注册到Eureka Server。
  3. Eureka Client服务提供者每30秒(默认配置)向Eureka Server发送http请求(心跳)服务续约。
  4. Eureka Server 90秒没有收到某Eureka Client的心跳请求,则统计15分钟是否存在85%的Eureka Client没有心跳,如果是则自我保护,如果不是则剔除该服务实例。
  5. Eureka Client通过定时任务向Eureka Server获取服务列表更新本地的列表缓存。
  6. Eureka Client远程调用的时候,先从本地查找,如果发现服务则发起请求,如果没有找到则向Eureka Server获取服务列表并更新换地缓存列表。
  7. Eureka Client应用关闭的时候会向Eureka Server发送关闭请求,Eureka Server受理后会剔除该服务实例。

Eureka集群高可用

  • Eureka Server集群当中每个节点都是用过 Replicate复制来同步数据。没有主从之分,节点的数据都保持最终一致。假设其中一个节点宕机了,并不影响Eureka Client的工作。

Zookeeper注册发现流程

  1. 启动Zookeeper。
  2. 服务提供者启动的时候注册到Zk注册中心。
  3. Zk注册中心和服务提供者建立一个Socket长连接,ZK注册中心定时向每个服务提供发送数据,如果服务提供没响应,则剔除该服务实例。将更新后的服务列表发送给所有的消费者(长连接)。
  4. 服务消费者启动从ZK中获取一份服务列表并缓存到本地。
  5. 服务消费者调用原创服务的时候先从本地缓存查找,如果找到则直接发起服务调用。如果没有找到则到ZK注册中心获取列表缓存到本地在调用。
  6. 当一个服务提供者宕机或者正常关闭的时候,ZK会剔除该节点,并通知所有消费者服务更新本地缓存。