[ 翻译 ] WePay服务网格系统的高可用

在本系列的前面两篇文章,在Webpay中使用Linkerd作为服务网格代理以及Sidecar和DaemonSet: 容器模式之争中,我们深入探讨了一些服务网格的细节,分别是服务网格代理( Linkerd)和这些代理的容器模式。 在本系列的第三部分中,我们将站在一个更高层面来看待服务网格系统。具体来说,我们将会从监控和告警两个角度来查看服务网格系统的健康性,并讲述如何使用各组数据来定义WePay基础设施中服务网格架构的高可用。 全景图 和我们在本系列中前面讨论的服务网格设定一样,这里给出的例子是一个跑在Google Kubernetes Engine(GKE)的Kubernetes集群上的高可用及模块化的服务网格。 我们在此之前经历了几次服务网格架构设计的迭代,而支持模块化的那个最能满足我们的…

Read More

[ 翻译 ] Thanos:大规模prometheus集群解决方案

【编者的话】Improbable开源了他们的Prometheus高可用解决方案Thanos,提供Prometheus的无缝集成,并为它带来了全局视图和不受限制的历史数据存储能力。 Fabian Reinartz是一名软件工程师,喜欢用GO语言造轮子并且热衷于解决难题。他是Prometheus的维护者并且是Kubernetes instrumentation特别兴趣小组(Kubernetes SIG instrumentation)的联合发起人。过去,他是SoundCloud的一名线上工程师,并且领导着CoreOS的监控团队。如今他在Google工作。 Bartek Plotka是Improbable的一名基础设施软件工程师。他对一些新兴技术和分布式系统的问题非常感兴趣。凭借着曾经在Intel…

Read More