部署 Envoy 代理来为 Monzo 提速

点击查看目录

编者按

本文介绍了使用 Envoy 来加速 Monzo,对比了使用 Linkerd 和 Envoy,通过试验证明 Envoy 拥有更小的延迟。

我们基础设施的一个核心组件是远程过程调用 (RPC) 系统。它允许微服务通过网络以可伸缩和可容错的方式彼此通信。

每当评估 RPC 系统时,通常会查看以下几个关键指标:

  • 高可用,服务之间的通信应该尽可能快。RPC 子系统应该做到延迟开销最小化,并在路由请求时避免路由到失败的服务副本。

  • 可伸缩性,平台每秒会收到数以万计的请求,随着用户基数的增长,这些请求的数量还在不断增加。所拥有的任何子系统都需要继续支持这种增长。

  • 可恢复性,当服务副本宕机、发生 bug 或者网络不可靠时。子系统应该能检测到不可用的下游和异常值,让系统收到反馈并绕过失败进行路由。

  • 可观察性,RPC 子系统生成大量关于平台性能的数据。与现有的度量标准和追踪基础设施集成,以在现有的服务度量标准和追踪的同时公开服务网格信息。

2016 年,我们写了一篇关于构建现代银行后台的博客,其中一个关键部分是服务网格,它由Linkerd 1.0提供支持。当我们在 2016 年选择 Linkerd 1.0 时,服务网格生态体系还比较年轻。

从那时起,许多新项目都追随了我们这个想法。我们想重新评估 Linkerd 1.0 是否适合我们的需求。

服务网格

我们的微服务每秒通过 HTTP 执行数万次 RPC 调用。然而,要建立一个可靠的、可容错的分布式系统,需要具有服务发现、自动重试、错误预算、负载均衡和熔断功能。

我们想建立一个支持所有编程语言的平台。虽然大多数微服务都是用 Go 实现的,但是有些团队选择使用其他语言 (例如,数据团队使用 Python 编写一些机器学习服务)。

在我们使用的每一种语言中实现这些复杂的特性,会对我们要使用的新事物设置很高的障碍。此外,对 RPC 子系统的更改将意味着重新部署所有服务。

我们早期做出的一个关键决定是尽可能地使这个复杂的逻辑脱离流程:Linkerd 对服务透明提供了许多特性。

img
img

我们运行 Linkerd 作为Kubernetes Daemonset。这意味着每个服务将与每个节点上运行的 Linkerd 的本地服务副本通信。

迁移到 Envoy

在我们为众筹做准备的过程中,我们发现 Linkerd 无法在不赋予它不成比例的处理能力的情况下处理负载。我们必须大规模扩展我们的基础设施来应对。随着我们业务需求的不断增长,运行 RPC 基础设施所需的资源数量是不可持续的。即使在正常的负载模式中,Linkerd 本身也是造成第 99 百分位延迟的主要因素。

我们开始评估与 RPC 子系统标准相匹配的替代方案。我们研究了 Linkerd 2.0、Istio 和 Envoy。我们最终选择了 Envoy,因为它具有高性能、相对成熟和广泛应用于大型工程团队和项目的能力。

Envoy是一个开源的高性能服务网格,最初由 Lyft 开发。它是用 C++编写的,因此不会受到垃圾收集的影响,也不会出现编译暂停。它是支撑 Istio 和 Ambassador 等其他一些项目的核心代理。

Envoy 并没有对 Kubernetes 的任何依赖。我们编写了自己的小型控制平面,它将监视 Kubernetes 基础设施中的更改 (例如由于新 Pod 而更改的端点),并通过集群发现服务(CDS) API 将更改推送给 Envoy,使其感知到新服务。

我们使用为测试众筹系统而开发的负载测试工具来测试现有的 Linkerd 和新的 Envoy 的性能。

img
img

在我们所有的测试中,Envoy 都比我们现有的 Linkerd 1.0 表现得好得多,同时需要更少的处理能力和内存资源。

与 Linkerd 相比,Envoy 缺少一些功能,比如延迟感知负载均衡 (而不仅仅是轮询) 和基于服务的错误预算 (而不仅仅是基于每个请求的自动重试)。最终,我们没有发现这些是交易破坏者,尽管我们想在未来添加它们。

我们希望转换对服务是透明的。在我们的推出中,一个关键因素是如果需要回滚,该更改的可回溯性。

我们设置了 Envoy 来接收和路由 HTTP 请求,就像 Linkerd 一样,并以 Kubernetes daemonset 方式将其推出。在几个月的时间里,我们在预发布环境中大量测试了这些更改。一旦到了投入生产的时候,我们就会在几天的时间里逐步推出它,以发现并解决任何在最后一刻出现的问题。

可观察性

虽然 Linkerd 1.0 有一个很好的控制平面,但它不能很好地与基于 Prometheus 的监控系统集成。在 Envoy 投入生产之前,我们对其与 Prometheus 的融合给予了密切关注。

我们回馈 Envoy 社区,完成了对 Prometheus 的一级支持。这允许我们拥有丰富的仪表板来增强现有的服务度量。

img
img

通过拥有这些数据,我们对首次展示获得了信心,以确保它是无缝的和无错误的。

当你的应用程序与我们的后端通信时,它会经过我们的边缘层,然后启用不同数量的微服务 (有时超过 20 个) 来满足请求。当我们推出 Envoy 时,我们看到我们的边缘延迟减少了,这证实了我们的测试结果。这最终意味着,对于所有使用 Monzo 的人来说,都能获得更快的应用体验。

img
img

Envoy 作为 sidecar

我们现在正在进行的一个关键项目是将服务移动到 Envoy Proxy 作为微服务容器的sidecar。这意味着,每个服务将拥有自己的 Envoy 副本,而不是与主机上的 Envoy 通信 (这是一个共享资源)。

我们采用 sidecar 模型,设置 Envoy 来处理出入口问题。传入的请求 (来自另一个服务或另一个 Envoy 的入口) 将通过本地 Envoy 传入,我们可以使用规则来验证流量是否合法。向外 (出口) 的流量将通过 sidecar Envoy,sidecar Envoy 像以前一样负责将流量路由到正确的地方。

img
img

转移到 sidecar 的一个关键优势是能够定义网络隔离规则。以前,我们无法锁定敏感的微服务,因为流量来自一个共享的 Envoy,所以只能在网络级别上接收来自某些 Kubernaetes Pod ip 的流量。服务必须有自己的逻辑来验证请求是否合法,是否来自可信源。

通过在 Pod 名称空间中移动 Envoy,我们能够向 Pod 添加Calico 网络策略规则,从而为每个微服务有效地建立网络防火墙。在这个例子中,我们可以说流量只能进入服务。来自其他微服务 Pod 的特定子集的帐户 Pod。通过拒绝网络级别上未知的流量,这提供了一个额外的安全层。

我们使用 Envoy 而不使用 Linkerd 的一个关键原因是,使用 Envoy 处理能力和内存需求显著降低。我们现在在我们的基础设施中运行了数千份 Envoy,随着我们将 Envoy 作为所有服务部署的 sidecar 推出,这个数字还在继续增长。

我们从 Envoy 中收获了什么

拥有 Envoy 是一段伟大的旅程。我们能够在不重新构建任何现有服务的情况下进行此升级,从而获得更好的洞察力。我们对所看到的资源消耗和延迟方面的改进非常满意,并且我们相信随着用户基数的增长,Envoy 能够支持我们未来的需求。

我们感谢您对 Envoy 社区提供的帮助和支持,并希望继续作出更多贡献。

编辑本页