MariaDB Server 在中国潜力巨大

我们在2022年4月的董事会会议上选举了两位经验丰富的新任投票董事会成员。其中一位是彭祥 (Sean),阿里巴巴云 RDS 开源数据库总监。我很高兴与他进行了一次炉边谈话,我们对此进行了录制并上传到 YouTube。请继续阅读他为 MariaDB Foundation 在中国发展提供的建议。
一位具备 MariaDB Foundation 理想履历的人
Sean,这是他自己给我们的称呼,以方便那些记不住、读不出或写不出他中文本名“彭祥”的人,他是 MariaDB Foundation 的宝贵资源。
首先,他既了解他的祖国中国,也了解西方,他毕业于威斯康星大学麦迪逊分校,并在美国工作了十年。
其次,他的第一份工作是在甲骨文 (Oracle) 位于雷德伍德城、那个有帆船的湖边的办公室——担任 Oracle Database 查询优化器团队的一员。
第三,他在 AWS 工作了六年,负责 Aurora MySQL。
现在,他回到了中国杭州,在阿里巴巴总部工作,领导着包括 MySQL、MariaDB 和 PostgreSQL 在内的开源数据库的工程和产品工作。
可以想象,这使得 Sean 在指导 MariaDB Foundation 在中国采取正确行动方面具有独特的优势地位。

回到中国感觉如何?
问完基本情况后,我问 Sean 回到中国是否开心?
“是的!从两个方面来说:”,Sean 回答。“首先,中国的互联网和云计算一直在蓬勃发展。因此我可以做很多在美国没有机会做的有趣项目。其次,家庭是从美国搬回中国最重要的动力。随着新冠疫情,旅行突然变得充满挑战”。
年轻的中国工程师对英文技术文档没问题
然后我直接问了一个核心问题,MariaDB Foundation 长期以来一直为此感到困扰:MariaDB Foundation 应该如何处理中文语言?
我注意到,作为一个欧洲人,对我来说重要的是以世界期望的语言来服务,而这种语言并非总是英语。在欧洲内部,德语是最大的母语,但法国人对使用非英语交流的要求更高。但这与中国相比仍然微不足道。
我试图梳理一下 MariaDB Foundation 应该如何处理中文语言的问题。具体来说,我将 MariaDB 的世界分为“西装人士”(管理者)和“技术人士”。我的假设是前者,即管理者,主要使用中文,而几乎所有工程师都可以轻松阅读英文技术文档。
“我认为这基本正确”,Sean 说。“但我想对此做一点澄清。在中国有庞大的 MySQL 和 MariaDB 用户和开发者社区。我想这大约始于2000年,也就是阿里巴巴和腾讯等所有互联网公司开始成立的20年前。与年轻一代的工程师相比,老一代的工程师受教育程度略有不同,对英语的关注较少,国际视野也较窄。因此,对于年轻一代的工程师来说,阅读英文的 MariaDB 文档没有困难。但对于高级管理者来说,像工程师那样灵活运用英语一直是一个挑战。”
那么,如何更好地服务中国市场呢?
我注意到 MariaDB Foundation 刚刚收到了季海东的一份贡献,包含了中文错误消息。因此我们确实也正在努力简化中国工程师的使用。但我的好奇心又回到了如何改善中国用户体验的问题上。
Sean,现在您是董事会成员了,从语言角度来看,您会如何指导 MariaDB Foundation 将精力投入到更好地服务中国市场?
“这是一个非常好的问题!首先,目前的开源数据库社区对 MariaDB 非常有利。看看 MySQL 的发展。有一些新功能比如 Heatwave,但它们不是开源的,而 MariaDB 则不同。从我个人的角度来看,我们真正应该做的是,如果这两个产品未来会分化,我们需要将 MariaDB 发展成为 MySQL 的直接替代品。这是第一点。”
“第二点”,Sean 继续说道,“至少在阿里云,我们对开源数据库投入了大量资金。这包括 MariaDB 和 MySQL。实际上,我们同时拥有 MariaDB 和 MySQL 的数据库内核开发者。我们希望将我们在 MariaDB 中开发的任何修复或新功能贡献回社区。”
“第三点:正如我所提到的,在过去的20年里,MySQL 在中国取得了很大的发展。我们也有工程师曾是 MySQL Server 和 InnoDB 团队的成员,他们与 Oracle MySQL 和 MariaDB 的开发者有着个人联系。”
这是 Sean 非常关心的问题。他总结道:“从市场角度来看,我会努力在迁移场景和云上的 MariaDB 新功能方面投入更多精力。”

我们需要将 MariaDB Server 文档放在中国境内
我坚持深入了解如何更好地服务中国市场的具体细节。在中国拥有什么样的文档或网络存在有多重要?考虑到中国的互联网环境,中国开发者访问我们的网站 mariadb.org 或知识库速度不快。Sean,您对此有什么指导?我们应该在中国境内放置一份文档的副本吗?
Sean 的回答是一个响亮而肯定的“是的,拜托”:“关于让中国的社区更容易访问文档,我认为这是一个非常好的建议。话虽如此,并没有防火墙阻止中国用户访问 MariaDB 网站。一直都有变通的方法,人们也一直在这样做。”
“但关键是,如果我们想接触更广泛的受众,在中国设立一个镜像网站总是很有益的,这样人们就可以轻松访问网站。通过这种方式,他们就不需要绕过中国互联网与外部互联网之间的障碍。所以如果我们有一个镜像网站,肯定会有帮助。”
“特别是对于科技行业的新手工程师以及大学里的学生,我特指的是未来的 MariaDB 用户和 MariaDB 开发者。如果我们能把网站放在那里,肯定会对 MariaDB 未来的普及非常有帮助。”

但我们不需要中文版的 MariaDB Server 文档
这些话非常明确。我还有另一个相关的问题:这些文档是否应该提供中文版本——其中一部分可能通过阿里的努力来实现?
“就语言而言,我认为没有必要提供中文版的文档。对于 MariaDB,我认为英语就足够了,而且我非常确定英语阅读能力在中国已经成为工程师职业生涯的基本技能很久了。所以工程师们应该理解英语并能阅读英文技术文档。”
从一位董事会成员那里得到如此清晰的判断,对于 MariaDB Foundation 来说非常有价值,因为从我们的角度来看,很难知道正确的答案。我经常去中国,Monty 也是,他作为 MySQL 和 MariaDB 的创建者,在中国简直是半神般的人物。但我们都只有一些猜测。所以能从当事人那里得到关于此事的诚实意见非常好。因此,在中国设立镜像很重要!但不是翻译所有文档。
然而,中文培训材料将很有价值
现在我们已经进入正题,我继续深入探究 Sean 关于本地化的想法
培训材料怎么样?我的看法是,提供英文培训材料不错,但如果需要翻译一些东西,我宁愿翻译培训材料,而不是翻译长达3000页的全部文档。
“没错!没错!”Sean 热情地回答道。“我可以谈谈个人经验:在过去一年我加入阿里巴巴以来,我们在中国有一个 MySQL 用户组,在中国也有一个 PostgreSQL 用户组。我没看到中国有 MariaDB 用户组!所以在培训课程或研讨会方面,我认为会很棒。”
在中国成立一个 MariaDB 用户组也一样
Sean 继续提出他自己的倡议
“我建议我们尝试成立一个用户组,一个 MariaDB 用户组,比如叫‘MUG’(MariaDB User Group)。这个名字很好听!它是一个在中国成立的 MariaDB 用户组。我们先成立组织。当然,我们需要吸引人们——无论是 DBA 还是热爱 MariaDB Server 和 MariaDB 产品的使用者。让我们壮大社区,然后在不同城市定期举办聚会。这会是我的建议,与您脑中的培训或研讨会想法相辅相成。”
我试着总结了一下。您会做三件事:一是设立镜像,以便轻松访问。二是制作中文培训材料。三是投入精力发展用户组,在各地进行拜访?
“是的!正如我所说,就 MySQL 和 PostgreSQL 用户在中国所做的事情而言,用户组一直是一个非常好的模式,可以吸引用户群,并帮助更多人理解和接受 MariaDB。”
我想知道我们应该如何考虑实地存在?现在疫情仍在持续,旅行不便。而且旅行的成本也很高,无论是时间和金钱。我问 Sean 应该如何分配精力?我的意思是,我明白一些旅行是有益的,我个人想去山城重庆看看——但或许很多事情只需要一次虚拟游览就能完成?
“这是非常好的见解!”Sean 说。“即使在中国,也有很多聚会、研讨会或技术会议。我们一直在网上进行,因为地方政府有时会实施封锁或采取措施防止病毒传播。所以我认为在新冠疫情消失之前,在线聚会将是一个起点。”

MariaDB 在阿里云居于核心地位
接着我转向了云和阿里巴巴。Sean 是阿里云的工程总监,目前负责 MySQL、MariaDB 和 PostgreSQL 的工程、产品和市场推广策略。那么这在实践中意味着什么?
“我们在阿里云有关系型数据库服务。”Sean 回答道。“这只是一个平台,我们向客户提供 MySQL 服务、MariaDB 服务和 PostgreSQL 服务。过去,我们的用户和客户拥有自己的数据中心,并在他们的数据中心运行自己的数据库、数据库进程或数据库服务。这与 AWS、GCP 和 Azure 所做的事情非常相似。我们有自己的 RDS 服务,并且一直在大力投资开源数据库,即 MySQL、MariaDB 和 PostgreSQL。”
“MariaDB 在这三项服务中是独一无二的。正如我提到的,在中国,大多数互联网公司都是伴随 MySQL 成长起来的,这与美国或欧洲的技术社区不同,在那里几乎一半的人使用 MySQL,另一半可能使用 PostgreSQL。但在中国,几乎九成,甚至可能更多,一直在使用 MySQL。”
我知道云公司对统计数据和数字相当保密。但这仍然是一个非常有趣的问题:您能透露一些统计数据吗?比如服务器数量、用户数量,任何能让我们了解规模有多大的信息?
“首先,谢谢你的理解!”Sean 笑着说道,对我说保密性的话表示理解。“我能看到的是,MariaDB 的普及率相当……这么说吧,MariaDB 在中国和东亚有巨大的潜力!这是我现在唯一能说的,好的:MariaDB 潜力巨大!”
阿里巴巴与 MariaDB 相关的代码去了哪里?
然后,我接着问了另一个技术问题,不确定是否敏感。当你们开发东西时,有多少工作是用于开发服务器代码库以针对云进行优化,又有多少是用于 Kubernetes 等周边脚本?所以你们工作的工程部分是什么?这些代码最终去了哪里?
“啊,这是个非常好的问题!”Sean 回答道。“这样说吧:80% 用于基础设施,我们进行实例管理和 Kubernetes 相关工作,而大约 20% 用于 MariaDB Server 的优化。错误修复,有时我们确实会遇到社区中尚未修复的 bug,还有一些方便的 DBA 功能,客户会说,嘿,我想要那个功能——你们能把它放到数据库服务里吗?我们有时会这样做。所以,是的,我认为是 80% 对 20%。
阿里巴巴能否在 Kubernetes 方面帮助 MariaDB Foundation?
在这 80% 的领域,MariaDB Foundation 几乎什么都没做。我们专注于服务器本身,但我们已经启动了一个项目来创建一个基本的 Kubernetes operator。我想任何云提供商都有大量 operator,而且非常复杂。我不确定阿里巴巴是否有可能将其 Kubernetes 脚本贡献回来,而且我认为云提供商无论如何也不愿意这样做。但是,阿里巴巴是否可以从普及的角度出发,指导我们并与我们合作创建,我们可以说,
一个基线的 Kubernetes operator?
Sean 回答说:“是的,这是个非常好的问题。在这里,我想说我们一直在做的事情是专门针对公共云的。我们确实拥有复杂而强大的基础设施。你描述的 Kubernetes operator 相关的东西是终端用户或客户希望在他们拥有的任何基础设施之上进行的操作。”
“我想强调的是,这两种不同的模式是相互补充的。它们不是互相替代的。所以为了提高普及率或让它在 MariaDB 社区更受欢迎,我认为为 MariaDB 提供一个与 Kubernetes 和容器相关的基础设施是件好事。”
Sean 继续说道:“我们可以在我们谈到的培训课程或研讨会中进行合作。在那里,我们可以让人们知道,当你想自己搭建 MariaDB 服务时,你可以选择这种方式,这就是我的建议。”

Sean 与他的董事会职位
现在 Sean 已经当选为 MariaDB Foundation 的投票董事会成员,我个人非常期待与中国,特别是 Sean 合作。我很好奇,Sean 作为董事会成员,对这个职位有什么计划?
“我脑中有三点。首先,我想尽最大努力与董事会合作,确保 MariaDB 保持现在的开放性。我想一直保持这种状态。”
“其次,我想利用这个机会结合我们在阿里巴巴这里以及在中国所做的事情,从而提高 MariaDB 的知名度和普及率。”
“第三,我想让阿里巴巴的开发者参与进来,回馈社区,并与社区共同成长。所以这三件事是我会做的,以确保 MariaDB 朝着健康的方向发展。”
这对我来说简直是天籁之音,因为这三点都与我们阐述的 MariaDB Foundation 使命非常契合——开放、普及和持续性。
那么,用这些话结束:非常感谢这次采访,彭祥!
“非常感谢,Kaj!很高兴与您交谈!”
: )
那是阿里巴巴,中国顶尖的IT公司。