MariaDB 贡献统计,2023 年 3 月

由于一系列问题,我们之前关于开发者指标的季度更新未能发布。然而,这次我们做了一些改动。在这篇文章中,我们将总结 2022 年以及 2023 年头几个月发生的事情。这篇博客文章的所有数据都可以通过 CSV 格式在 MariaDB 指标仓库的发布部分找到,同时还有生成指标所需的一切。

指标收集的变更

对于主要的提交指标,我们使用一个名为“GitDM”或 Git 数据挖掘器的工具,该工具是为 Git 内核树开发的,用于按个人和组织对提交进行分组。我们对此进行了多方面修改,以使其能够提供我们所需的报告,并更好地与我们的 Git 树协同工作。此外,我们还围绕它编写了脚本来自动化报告。所有这些都是开源的,可在此处获取。我们还拥有从 GitHub API 挖掘的拉取请求统计数据。

最显著的变化体现在分类方面。以前我们基本上是使用不同配置重新解析指标,该配置使用类别而非组织数据。这很快就变得不同步且难以维护。因此,我们修改了 Gitdm 的输出,使其包含一个组织到类别的映射。然后它会在“organisations”CSV 文件中输出一个额外的列来显示其所属的类别,并且可以生成一个仅包含类别的 CSV,这比我们之前的数据更准确。

我们还增加了几个围绕 MariaDB 服务器跟踪的项目。它们是

  • mariadb_kernel – 用于 Jupyter notebook 的 MariaDB 内核,未来这个仓库可能会重命名,以避免与操作系统内核混淆
  • mariadb-docker – 一个用于 MariaDB 服务器的 Docker 配置
  • mariadb-connector-c – 用于 MariaDB 的客户端库

最重要的是,我们对用于确定哪个开发者属于哪个组织的配置文件进行了一些修复和清理。

最后,最明显的变化是 MariaDB Corporation 作为其 IPO 的一部分已更名为 MariaDB Plc.。缩写时我们将使用其股票代码 (MRDB)。我们尚未在 GitDM 配置中进行此更改,但这将在下次数据快照之前完成。

2022 年顶级组织

在深入探讨更广泛的统计数据之前,我想重点介绍一下在 2022 年对 MariaDB 服务器做出贡献的顶级组织,它们是

名称开发者提交数
MariaDB Plc.361816
MariaDB 基金会8179
亚马逊1554
GSoC334
Codership532
按提交数排序的 2022 年前 5 名组织

不出所料,MariaDB Plc. 位居榜首,他们为 MariaDB 服务器支付了最多的全职开发者,但也有其他有趣的组织。亚马逊的贡献迎来了丰收年,这比他们 2021 年的贡献数量增加了一倍多,从当前的拉取请求池和已合并的提交来看,2023 年的贡献将更多。紧随其后的是 Google Summer of Code,正如我本周早些时候在博客文章中提到的,我们是 Google Summer of Code 项目的坚定支持者,很高兴看到这些新贡献者带来的贡献。

深入探讨

现在,让我们深入研究数据。由于脚本和配置问题,2022 年 9 月的报告有点容易出错,但我们现在已经改进了流程,这份报告应该会准确得多。现在我们已进入 2023 年,报告范围是 2020 年至 2023 年(截至 3 月初)。

首先是每个组织的提交数。

类别实体2020202120222023总计
MDBBMariaDB Plc.2460 / 81.43%2123 / 83.39%1816 / 82.51%342 / 74.35%6741 / 81.93%
MDBFMariaDB 基金会297 / 9.83%192 / 7.54%179 / 8.13%80 / 17.39%748 / 9.09%
提供商Codership71 / 2.35%56 / 2.2%32 / 1.45%14 / 3.04%173 / 2.1%
CONNECT65 / 2.15%55 / 2.16%1 / 0.05%121 / 1.47%
Tempesta2 / 0.07%3 / 0.18%5 / 0.06%
赞助IBM63 / 2.09%5 / 0.2%1 / 0.05%69 / 0.84%
GSoCGSoC1 / 0.03%8 / 0.31%34 / 1.54%43 / 0.52%
发行版所有发行版20 / 0.66%20 / 0.79%17 / 0.77%2 / 0.43%59 / 0.72%
其他亚马逊2 / 0.07%24 / 0.94%54 / 2.45%9 / 1.96%89 / 1.08%
其他40 / 1.32%60 / 2.36%67 / 3.04%13 / 2.83%180 / 2.19%
总计3021254622014608228
按组织划分的提交数

注释

  1. 在被 IBM 收购后,Red Hat 处于灰色地带。在此表格中,我们将其归类为“发行版”,与 IBM 和“赞助商”分开。
  2. “CONNECT”代表 CONNECT 引擎的贡献,这些贡献来自一位作者。
  3. “赞助商”和“提供商”类别中有更多实体,但为简化起见,在此表中已将它们与独立贡献者一起归入“其他”类别。
  4. 提交数并不能完全说明问题,一次提交可能只有一行代码,也可能有数千行。

接下来是 2022 年对其他项目的贡献数量,格式为“提交数 / 开发者”

libmarias3ColumnStore 引擎Connector/CMariaDB Docker
MariaDB Plc.2 / 2513 / 17113 / 915 / 1
MariaDB 基金会100 / 2
GSoC11 / 2
亚马逊1 / 1
其他6 / 25 / 44 / 3
2022 年其他 MariaDB 项目的提交数 / 开发者数
  1. MariaDB Jupyter Kernel 仓库在 2022 年没有提交,因此被省略。2023 年,尤其是一些独立开发者在此项目上投入了更多工作。

拉取请求

最后,我们来看看过去几个季度 MariaDB 服务器的拉取请求指标。这显示了该周新开启的 PR 数量、已关闭但未合并的 PR 数量以及已合并的 PR 数量。最后两列显示了累计的 PR 总数以及在该周结束时仍开放的 PR 数量。

截止周新增 PR已关闭 PR已合并 PRPR 总数仍开放 PR
2022-09-0411162243118
2022-09-116352249116
2022-09-189342258118
2022-09-2510762268115
2022-10-022152270111
2022-10-092112272111
2022-10-165142277111
2022-10-23113132288106
2022-10-30174172305102
2022-11-066012311107
2022-11-136452317104
2022-11-208112325110
2022-11-2711322336116
2022-12-0410782346111
2022-12-1110442357113
2022-12-1811262368116
2022-12-2516572384120
2023-01-013002387123
2023-01-08249152411123
2023-01-1513562424125
2023-01-22121262436119
2023-01-29173142453119
2023-02-0517032470133
2023-02-12143122484132
2023-02-1951102489126
2023-02-267232496128
2023-03-0518542514137
拉取请求计数

由此得出几个结论

  1. 我们收到了大量的拉取请求,虽然已尽力处理,但仍在落后。
  2. 2022 年底大家都在休假,2023 年 2 月初许多人参加了 FOSDEM,这显著减少了可能的评审数量。

自本报告结束以来,新 PR 数量呈快速上升趋势。这可能是由于 GSoC 候选者涌入并熟悉代码库,以及来自亚马逊等实体的巨大涌入。

基金会在 2023 年的核心重点之一将是努力进一步降低这个数字。

致谢

根据统计数据和当前开放的拉取请求,我们应该感谢一些特别的人

  • 亚马逊 RDS 团队做出了大量贡献,并让我的代码评审工作非常繁忙。
  • 独立贡献者黄伟君 (Weijun Huang),他曾是一名 GSoC 学生,迄今为止是 2023 年最大的独立贡献者。
  • 来自 MariaDB Plc. 的 Alexander Barkov,他在 2022 年修改的代码行数比任何人都多!

发布者:Andrew Hutchings

MariaDB 基金会首席贡献官