贡献统计数据发布

在上次会议中,MariaDB Foundation 董事会提议定期发布贡献统计数据。本文是对我们进展情况的更新以及第一份报告。
自董事会会议以来,该项目取得了一些进展,其中大部分进展发生在八月中旬之后,并且改进仍在快速进行中。我将在下面分解该请求和我们的进展情况。
每月统计数据发布
MariaDB Foundation 开始每月定期发布贡献者统计数据,包括 a) 代码行数和 b) 提交次数。
统计数据目前使用报告时的指标 git 仓库快照发布,以便对所使用的方法和配置进行审查。它们将包括代码行数和提交次数的详细信息。
这些报告将以季度频率通过博客文章和董事会会议获得额外关注。
这将通过本文作为第一份报告来实现。
该报告考察了前三年的代码贡献。
报告输出目前包括过去 3 年以及本年度至今的所有数据。因此,对于本报告而言,时间范围是 2019 年至 2022 年。
类别
下一点是关于提交次数的分类。
统计数据中的每个独立开发者都根据其薪水来源被归类到三个类别之一:a) 财务赞助商,b) 非赞助商,c) 基金会员工。
我们采用的是一种多层级的方法,这可能比上面提到的要复杂一些。首先,如果找到相关的组织,每个贡献者都会与该组织关联,否则他们将被标记为“个人”。目前我们将组织分为以下类别
- MariaDB Corporation
- MariaDB Foundation
- 赞助
- GSoC (Google Summer of Code)
- 提供商
- 发行版
- 其他
这两个 MariaDB 实体贡献数量最大,因此被单独列出,以便根据需要添加或移除。赞助商指赞助 MariaDB Foundation 的实体。发行版涵盖来自各种 Linux 和 BSD 发行版的贡献。提供商通常是使用 MariaDB Server 提供服务的组织。最后,“其他”是独立贡献者或不属于其他类别的贡献者。
这种细分级别可以轻松合并以创建所请求的三个类别。但我们认为它可以提供更有用的统计数据。话虽如此,我们乐于接受关于分类更改的建议,并且数据可以轻松重新生成。
透明度
这些统计数据由一个透明的脚本运行,该脚本将发布在 Github 上,接受公众监督。
我们已经完成了这一点,它可以在 GitHub 上的“metrics”仓库中找到,并且我们在之前的博客文章中请求了公众监督。
统计数据还区分了 MariaDB Server 核心和插件。
目前我们还没有做到这一点。我们打算通过任务 MDBF-466 来实现。用于生成统计数据的工具“gitdm”目前还没有这种细分级别,因此需要我们进行一些修改。
代码审查指标
最后一点是 Eric 提出的
讨论:Eric 指出监控审查的重要性(因为审查者是稀缺资源)。
我们也有一个脚本来监控这一点。虽然目前它不监控单个审查者,但它每周监控审查的当前开放/关闭状态。
第一份报告
至此,这是第一份报告。可以从此处获取 GitHub 版本中的 CSV 数据,以及用于生成数据的代码和配置快照。目前,类别信息可能还需要一些调整才能完全符合要求。
我们努力在公平地展示贡献者和不过度拉长下面的矩阵之间取得艰难的平衡。我们欢迎对这些呈现方式提出问题和评论。
作为一个简单的示例,下表显示了不同类别的代码行数及其占总数的百分比。然而,新增代码行数并不能完全反映情况,所以我们将进一步深入探讨。
类别 | 2019 | 2020 | 2021 | 2022 |
MDBC | 539484 / 82.39% | 785029 / 91.56% | 792562 / 90.76% | 1317885 / 95.27% |
MDBF | 26553 / 4.06% | 17395 / 2.03% | 28008 / 3.21% | 37780 / 2.73% |
提供商 | 55237 / 8.44% | 38483 / 4.49% | 29419 / 3.67% | 10327 / 0.75% |
赞助 | 1439 / 0.22% | 15174 / 1.77% | 359 / 0.04% | 1 / 0% |
GSoC | 4824 / 0.74% | 55 / 0.01% | 11735 / 1.34% | 5188 / 0.38% |
发行版 | 666 / 0.1% | 261 / 0.03% | 122 / 0.01% | 93 / 0.01% |
其他 | 26570 / 4.06% | 1035 / 0.12% | 11008 / 1.26% | 11989 / 0.87% |
总计 | 654773 | 857432 | 873213 | 1383263 |
第一个矩阵表格表示当年的提交次数以及占总提交次数的百分比,并包含所有年份合计的总数列。
类别 | 实体 | 2019 | 2020 | 2021 | 2022 | 总计 |
MDBC | MariaDB Corporation | 2954 / 84.54% | 3570 / 84.5% | 3217 / 82.91% | 2578 / 81.53% | 12319 / 83.46% |
MDBF | MariaDB Foundation | 256 / 7.33% | 356 / 8.43% | 307 / 7.91% | 357 / 11.29% | 1276 / 8.64% |
提供商 | Codership | 80 / 2.29% | 94 / 2.22% | 75 / 1.93% | 53 / 1.68% | 302 / 2.05% |
CONNECT | 54 / 1.55% | 65 / 1.54% | 55 / 1.42% | 1 / 0.03% | 175 / 1.19% | |
Amazon | – | 2 / 0.05% | 27 / 0.7% | 50 / 1.58% | 79 / 0.54% | |
Oracle Corporation | 14 / 0.4% | 11 / 0.26% | 4 / 0.10% | 1 / 0.03% | 30 / 0.2% | |
Tempesta | 17 / 0.49% | 4 / 0.09% | 3 / 0.08% | – | 24 / 0.16% | |
华为 | 1 / 0.03% | 5 / 0.12% | 14 / 0.36% | 2 / 0.06% | 22 / 0.07% | |
赞助 | IBM | 35 / 1% | 63 / 1.49% | 4 / 0.1% | 1 / 0.03% | 103 / 0.7% |
ServiceNow | 12 / 0.34% | 5 / 0.12% | – | – | 17 / 0.12% | |
GSoC | GSoC | 3 / 0.09% | 1 / 0.02% | 62 / 1.6% | 27 / 0.85% | 93 / 0.63% |
发行版 | 所有发行版 | 15 / 0.43% | 22 / 0.52% | 20 / 0.52% | 11 / 0.35% | 68 / 0.46% |
其他 | 其他 | 53 / 1.52% | 27 / 0.64% | 92 / 2.37% | 81 / 2.56% | 253 / 1.71% |
总计 | 3494 | 4225 | 3880 | 3162 | 14761 |
第二个矩阵表格显示了每个实体新增和删除的代码行数。删除的行可能是被新增的行替换的行,也可能是完全删除的行。反之亦然,您可以在提交中新增代码行而不删除旧代码行。这就是为什么删除的行数可能多于新增的行数。
类别 | 实体 | 2019 | 2020 | 2021 | 2022 |
MDBC | MariaDB Corporation | 539484 / 535998 | 785029 / 2906979 | 792562 / 297859 | 1317885 / 499848 |
MDBF | MariaDB Foundation | 26553 / 24541 | 17395 / 13482 | 28008 / 11637 | 37780 / 15588 |
提供商 | Codership | 39457 / 10938 | 15062 / 2622 | 16857 / 6308 | 7545 / 1286 |
CONNECT | 10524 / 8247 | 22163 / 9432 | 9342 / 2498 | 7 / 5 | |
Amazon | – | 19 / 2 | 985 / 338 | 2601 / 4533 | |
Oracle Corporation | 690 / 112 | 162 / 423 | 1392 / 27 | 144 / 55 | |
Tempesta | 3991 / 837 | 822 / 247 | 437 / 212 | – | |
华为 | 575 / 35 | 255 / 320 | 406 / 218 | 30 / 21 | |
赞助 | IBM | 814 / 404 | 15108 / 8431 | 359 / 27 | 1 / 0 |
ServiceNow | 625 / 512 | 66 / 71 | – | – | |
GSoC | GSoC | 4824 / 268 | 55 / 72 | 11735 / 3784 | 5188 / 1968 |
发行版 | 所有发行版 | 666 / 661 | 261 / 116 | 122 / 30 | 93 / 96 |
其他 | 其他 | 26570 / 3206 | 1035 / 375 | 11008 / 4245 | 11989 / 2098 |
总计 | 654773 / 585759 | 857432 / 2942572 | 873213 / 327183 | 1383263 / 525498 |
备注
1. 红帽 (RedHat) 在被 IBM 收购后处于灰色地带。对于此矩阵,我们将其归类到“发行版”下。
2. Tempesta 在原始数据中属于 MariaDB Corporation,但在此处移至“提供商”类别。
3. 任何在日期范围内贡献次数少于 10 次的组织(无论在哪个部分)都已与独立贡献者一起被合并到“其他”类别。所有 Linux / BSD 发行版无论贡献数量多少都已合并。这样做是为了使矩阵更紧凑。
4. “CONNECT”表示 CONNECT 引擎的贡献,这些贡献由一位作者完成。
最后,这是自八月初以来拉取请求(Pull Requests)的状态。它显示了该周新开启的 PR 数量、已关闭但未合并的数量以及已合并的数量。最后两列显示了截至该周结束时的 PR 总数以及仍未关闭的数量。
截止周 | 新增 PR | 已关闭 PR | 已合并 PR | 总 PR | 仍未关闭 PR |
2022-08-07 | 12 | 3 | 5 | 2219 | 113 |
2022-08-14 | 8 | 5 | 2 | 2227 | 114 |
2022-08-21 | 3 | 2 | 0 | 2230 | 115 |
2022-08-28 | 4 | 2 | 4 | 2234 | 113 |
2022-09-04 | 11 | 1 | 6 | 2245 | 117 |
特色图片来源:Alpha Stock Images