游客

Dropbox公司的Go语言探索之路

游客 2017-07-25 14:28:19    202521 次浏览

Tammy 援引 Rob Pike 于 2012 年撰写的《谷歌Go 语言:专为软件工程服务设计的编程语言》中的说法,解释了 Go 语言为何能够在 Dropbox 公司当中发挥重要作用:

“Go 语言高效、可扩展且极具生产能力。一部分程序员乐于加以运用,但也有一些人认为其难以理解甚至非常无聊。在这篇文章中,我们将解释为什么这些立场本身并不矛盾。Go 语言旨在帮助谷歌公司解决其在软件开发方面面临的各类问题,这意味着其尽管不能算是一种突破性的研究型语言,但仍然成为大型软件工程项目当中的出色工具。” — Rob Pike, 2012

  Dropbox 公司拥有庞大的业务规模:

  • 超过 5 亿名用户;
  • 20 万商业客户;
  • 500 PB 用户数据;
  • 数据 EB GO 存储系统。

正因为如此,Dropbox 公司对自身系统、语言以及工程师提出了极高要求。其指导原则与要求包括:

  •  构建高可靠性系统;
  • 构建安全系统;
  • 将可靠性与安全性纳入初始设计;
  • 可靠性需要达到 99.9999999999% (12 个9);
  • 可用性需要达到 99.99%。

  Dropbox 公司对 Go 语言的应用

目前,Dropbox 公司的大部分基础设施以 Go 语言编写而成,具体包括:

  • Go 服务器库拥有 150 名贡献者(来自总计 500 名工程师);
  • Dropbox 公司内超过 15 个团队负责构建及运行 Go 服务;
  • Dropbox 公司内部拥有 130 万行 Go 代码;

另有一部分关键性系统亦由 Go 语言编写而成:

  • RAT: 限速与限流工具。
  • HAT: memcached 的替代方案。
  • AFS: 一套用于替代全局 Zookeeper 的文件系统。
  • Edgestore: 分布式数据库。
  • Bolt: 用于消息收发。
  • DBmanager: 用于对 Dropbox 内超过 6000 套数据库进行自动化管理与监控。
  • “Jetstream”、“Telescope” 、分块路由以及更多……

其中相当一部分都继承自原本的非 Go 系统。

  Dropbox 公司当初为何选择使用 Go?

Tammy 亦分享了 Dropbox 公司一步步增加 Go 语言使用量的轶闻趣事。

  Hack 技术周成就 Go 速率限制器原型设计

在某一年的 Hack 技术周之前,Dropbox 的工程师们计划针对各项服务分别进行限速与限流。因此,一位工程师决定在接下来的 Hack 技术周内构建一项通用服务以实现上述目标——而 RAT 也就此诞生。

RAT 的初始原型设计在 4 天之内即构建完成,并在第 5 天发布了演示。短短几周之后,RAT 的大名在公司内部迅速扩散。另一位 Dropbox 工程师通过电子邮件与 Tammy 团队取得了联系,希望了解其如何在 Python 项目当中使用 RAT。整个整合进程进展顺利,RAT 的采用率不断提高,实用性也快速增强。目前,Dropbox 公司内已经有多个团队在使用 RAT。

  DBmanager

Dropbox 公司拥有超过 6000 套数据库,这样的大型系统自然需要自动化管理与监控措施与之配合。事实上,这些数据库随时随地都在进行复制、故障转移以及通过副本进行主体升级等等。

为了管理这一切,Dropbox 公司的一名工程师开发出 DBmanager——这是一套 Web UI,能够帮助管理员快速查看全部 6000 多套数据库中发生的状况。另外,其还能够将状态信息发布至其它系统。

  Dropbox 公司中的 Go 版本升级之路

在数百名工程师的配合下,Dropbox 公司小心翼翼地协调着 Go 语言各主要版本的升级工作。不过 Tammy 并没有提到任何由升级带来的问题,这表明整个过程应该相当顺利!

下面来看一些有趣的事实:

  • Dropbox 公司最近刚刚完成生产服务当中由 Go 1.5 到 1.6 版本的升级;
  • 为了追踪升级流程,工作人员创建了一份简单的 Dropbox Paper 文档,同时要求每位服务。

持有者报告进度并在必要时申请帮助。

Dropbox 公司决定在 1.6 版本迁移完成之后(包括各非生产服务),跳过 Go 1.7 并直接升级至 1.8 版本。

  Dropbox 公司如何引导新晋工程师们使用 Go 语言

每一位 Dropbox 工程师都需要经历同样严格的 Go 语言培训流程,具体包括:

  • 阅读基础设施拓扑资料、Go 语言风格指南以及 Protobuf 风格指南。
  • 严格但友好的代码审查。
  • 利用 Go 语言构建一款娱乐性质的应用程序(一套应用商店)。
  • 学习利用 Bazel 构建并测试 Go 代码。

经验丰富的工程师大约需要一周时间以完成上述培训。

  Go 语言为 Dropbox 公司带来哪些收益?又存在哪些不足?

总体而言,Dropbox 公司的 Go 应用之路非常成功。

  • 易于在 Go 语言环境下进行生产。
  • 易于在 Go 语言环境下编写并消费服务。(人们也热衷于此!)
  • Go 语言标准库非常出色。
  • 调试工具(总体上)运作良好。

其中的关键在于,Dropbox 公司并没有费力将 Go 编写成的服务重写为其它语言版本,这表明人们对其相当满意。(有趣的是,Tammy 表示 Dropbox 公司也在部分使用 Rust,但其并不属于 Go 的替代品。)

  Dropbox 公司在使用 Go 语言时遇到哪些困难?

Tammy 证实称,Go 语言最大的问题在于处理竞态条件。

  • 数据竞态类 bug 给调试、查询与修复等工作带来挑战。
  • 一部分 Dropbox 工程师特别擅长处理 Go 语言的查询机制,而另一部分工程师则选择发挥自己的专长。
  • Go 数据竞态检测器有时候不起作用。确定这种不起作用的情况非常重要。
  • 必须以审慎的态度设计需要对数据进行并发访问的 Go 程序。

Dropbox 公司重视工程师对于可靠性及持久性的关注度,因此他们亦应当有能力解决上述问题(事实上,这种并发处理问题在任何语言环境下都相当困难)。

内容加载中