本月 MariaDB 基金会动态:2025 年 2 月

Adoption Index 1

测量行为会扰乱系统并改变其状态。”这句引言被归于维尔纳·海森堡。虽然我不确定海森堡是否说过完全相同的话,但我确定“不衡量就无法管理”这句管理格言受到了很多负面评价,这是它应得的。

指标并非有害

然而,指标可能很有帮助。MariaDB 基金会远未过度衡量那些经理们关注的数字,在二月份,我们尝试系统地创建一个易于计算的、有意义的指标。

开源的一个缺点是我们没有社区规模的显而易见指标。MariaDB Server 有多少用户?这是一个容易的问题,但很难回答。确切地说,什么是用户?我们不需要注册,并且我们总是优先考虑发展生态系统,而不是获取其规模的更精确测量。

引入 MariaDB 采用指数(Beta 版)

不确定性是挑战,而不是放弃的理由。

所以现在,我们首次分享月度公开的 MariaDB 采用指数。为什么?我们希望建立易于获取的数字,来衡量 MariaDB [基金会] 的成功程度。 

由于这是一个新概念,在介绍时请原谅我有些啰嗦。对于读者中的 TL;DR(太长不看)粉丝:请查看图表,快速浏览表格,然后跳到“回到我们 2025 年的六个目标”部分。

在这个初始月份,我们汇总了一个指数,总结了从 mariadb.org 上的实际下载量到社交媒体关注者等 21 个 KPI。 我们将努力保持一致性和灵活性:KPI 和权重可能会在接下来的几个月根据良好的反馈和理由进行调整,但主要思想将保持不变。

这个想法类似于股票指数。我们创建一个数字,将其定义为 2024 年 1 月初的 100,然后让 KPI(很像个股)随时间影响指数。新的“股票”(KPI)可以被纳入,但追溯值应保持不变。

Adoption Index 2
MariaDB 采用指数 – 2025 年 2 月 Beta 版

在上图中,该指数从 2024 年 1 月的 100(未显示,因为我们展示的是滚动 12 个月)增长到 2025 年 2 月的 145。

然而,我们仍然将此指数标记为“Beta 版”。指数的计算并非一成不变,因为我们选择的 21 个 KPI 并非唯一可能的,其内部权重(“各个 KPI 的市值”)也并非显而易见的。

因此,请将当前的指数视为“RFC”,即征求意见稿。

MariaDB 采用指数的计算方法

以下是我们的 KPI 详细信息

Adoption Index 3
MariaDB 采用指数的计算方法

各个 KPI 的权重显示在顶部的饼状图中。以下是我们如何选择它们的几点思考

  • 采用类别的总权重为 40%:最真实的指标是正在运行的 MariaDB 数据库数量。由于无法获得此类数字,我们确定的次佳指标是来自 mariadb.org 的下载量(20%)、通过 Debian 的安装量(10%)以及 Docker 官方镜像的拉取量(10%)。不幸的是,Docker 镜像拉取统计数据在 2023 年底至 2024 年 9 月期间出现重大异常,因此我们决定从 2025 年 1 月起纳入 Docker 拉取量,对前几个月保持中立影响。 
  • 贡献类别的总权重为 19%。贡献数量是衡量开源项目健康状况的重要指标——因此该指数中的一个主要指标是外部贡献者每月创建的 PR 数量(5%)和独立贡献者的数量(5%)。此外,我们还关注总体受欢迎程度,包括 GitHub Star 数(3%)、在其他 GitHub 项目的 README 中提及 MariaDB 的次数(3%),以及 MariaDB Zulip 聊天中的新用户数量(3%)。 
  • 外部类别占比 20%,衡量 MariaDB 在 Google Trends 上的表现(5%)、所有语言的维基百科文章浏览量(5%) 以及涵盖多个指标的 DB Engines 排名分数(10%)。 
  • 开发者网络占比 9%,代表开发者常用的论坛:Reddit、Hackernews 和 Stackexchange,其中关于 MariaDB 的讨论表明了开发者对 MariaDB 的活跃程度。 
  • 社交媒体的总权重为 12%,概述了关于 MariaDB 的帖子触达开发者、决策者、用户和其他相关方的效果。我们关注 LinkedIn、Youtube、Fosstodon、Instagram 和 X 上的关注者/订阅者数量。 

定义 MariaDB 采用指数时的挑战

我们努力仅使用公开可获取的数字。例如,YouTube 内容观看次数只有账户管理员才能看到,而 YouTube 频道关注者是公开数字。  

在 KPI 的选择上有许多看似微不足道的选择。我们是关注月度变化量还是累计数量?是关注关注者/订阅者数量而不是实际的展示次数或观看次数?我们尽量做出了合理的选择。 

有些看似基础的数字也存在挑战,例如 Docker 官方镜像的拉取统计数据,我们发现 MariaDB(以及 MySQL 和 PostgreSQL)存在严重的异常。在 2023 年 10 月到 2024 年 10 月期间,由于 Docker 的技术更改导致镜像自动重新拉取,每月拉取量显示为正常水平的 4 倍甚至 5 倍。在尝试规范化这些数字后,我们决定在指数中从 2025 年 1 月开始计算 Docker 拉取量。 

那么,我们做得怎么样?哪些地方应该调整或增加?请告诉我们!

未来计划:外部可复现性

我们获知了 Scarf 解决方案,它有助于收集开源项目的销售和市场情报。我们正在研究如何将其应用于 MariaDB。

虽然我们仍在迭代定义,但大部分工作是手动完成和/或基于 Google 表格。随着时间的推移,我们希望自动化数据收集并使其更加公开。想象一个 GitHub 仓库、curl、json 对象和一些 GitHub Actions。敬请关注!

回到我们 2025 年的六个目标

您可能还记得我在一月更新中介绍的 2025 年六个目标。

  1. 社区分析:了解我们的现状!
  2. 贡献:让 MariaDB 成为充满活力的开发者社区!
  3. 推广:向现有和潜在用户宣传以推动采用!
  4. 向量与人工智能:为 MariaDB Server 引入新用户!
  5. 让 MySQL 用户更轻松地使用 MariaDB!
  6. MariaDB 高校计划:使用 MariaDB 支持数据库教学!

虽然我们在二月份一直在努力实现所有这些目标,但我想重点强调最显著的成果——我们在推广方面的工作。

MariaDB 日在布鲁塞尔 FOSDEM 期间举行

布鲁塞尔 FOSDEM 期间的 MariaDB 日取得了成功,如博客文章 MariaDB Day Brussels Aftertaste 2025-02 中所述。一些细节如下:

  1. Nikita Malyavin, MariaDB / Sergei Golubchik, MariaDB, 当客户端和服务器相隔一个秒差距时
  2. Vicențiu Ciorbaru, MariaDB 基金会, 开启你的开源职业生涯:向 MariaDB 贡献的第一步
  3. Sergei Golubchik, MariaDB, 认识最新的 MariaDB 版本
  4. Otto Kekalainen, MariaDB 中服务器发起的即时故障转移
  5. Peter Zaitsev, Percona, MariaDB 11 中精彩绝伦的特性
  6. Kristian Nielsen, MariaDB 基金会, MariaDB 复制:易于使用还是易于滥用?
  7. Roman Nozdrin, MariaDB, 迈向新高度:探索 ColumnStore 的真正能力
  8. Sergei Golubchik, MariaDB, 了解 MariaDB 极速原生向量搜索
  9. Jags Ramnarayan, SkySQL, 使用 MariaDB 的 VectorDB 和 SkySQL 的 AI Agents 构建 GenAI 驱动的应用
  10. Diego Dupin, MariaDB, 启动加速器:在 MariaDB 中使用 LLM 的具体案例

其中几场演讲与其他目标相关——包括贡献、MariaDB 11.8 的核心向量特性,以及让 MySQL 用户更轻松地使用 MariaDB。

在 FOSDEM 之后,我在伦敦的 State of Open Con25 上就开放数据发表了一场演讲:通过用无偏的开放数据喂养 AI 巨龙来拯救世界。这里主要的 MariaDB 视角是 MariaDB Vector 作为喂养整体 AI 巨龙的工具。虽然标题有点夸张,但世界现状也确实如此—— 如果您能抽出十五分钟时间,可以听听演讲录音,它与幻灯片一起被合并到一篇链接自上方博客文章的 YouTube 视频中。

新版本发布 – 以及一篇 LTS 博客

二月是发布月。Ian Gilfillan 写了两篇发布公告:

在相关方面,我们分享了 MariaDB 11.8 是 LTS 版本的消息——它将在五月正式发布 (GA)。

外部观察

最后,这里是一些来自 Reddit、Medium 和其他地方关于 MariaDB 的值得注意的外部观察:

您怎么看?

您怎么看?请与我们分享您的反馈!可以通过评论、Zulip 或电子邮件。