本月 MariaDB 基金会动态:2025 年 2 月

“测量行为会扰乱系统并改变其状态。”这句引言被归于维尔纳·海森堡。虽然我不确定海森堡是否说过完全相同的话,但我确定“不衡量就无法管理”这句管理格言受到了很多负面评价,这是它应得的。
指标并非有害
然而,指标可能很有帮助。MariaDB 基金会远未过度衡量那些经理们关注的数字,在二月份,我们尝试系统地创建一个易于计算的、有意义的指标。
开源的一个缺点是我们没有社区规模的显而易见指标。MariaDB Server 有多少用户?这是一个容易的问题,但很难回答。确切地说,什么是用户?我们不需要注册,并且我们总是优先考虑发展生态系统,而不是获取其规模的更精确测量。
引入 MariaDB 采用指数(Beta 版)
不确定性是挑战,而不是放弃的理由。
所以现在,我们首次分享月度公开的 MariaDB 采用指数。为什么?我们希望建立易于获取的数字,来衡量 MariaDB [基金会] 的成功程度。
由于这是一个新概念,在介绍时请原谅我有些啰嗦。对于读者中的 TL;DR(太长不看)粉丝:请查看图表,快速浏览表格,然后跳到“回到我们 2025 年的六个目标”部分。
在这个初始月份,我们汇总了一个指数,总结了从 mariadb.org 上的实际下载量到社交媒体关注者等 21 个 KPI。 我们将努力保持一致性和灵活性:KPI 和权重可能会在接下来的几个月根据良好的反馈和理由进行调整,但主要思想将保持不变。
这个想法类似于股票指数。我们创建一个数字,将其定义为 2024 年 1 月初的 100,然后让 KPI(很像个股)随时间影响指数。新的“股票”(KPI)可以被纳入,但追溯值应保持不变。

在上图中,该指数从 2024 年 1 月的 100(未显示,因为我们展示的是滚动 12 个月)增长到 2025 年 2 月的 145。
然而,我们仍然将此指数标记为“Beta 版”。指数的计算并非一成不变,因为我们选择的 21 个 KPI 并非唯一可能的,其内部权重(“各个 KPI 的市值”)也并非显而易见的。
因此,请将当前的指数视为“RFC”,即征求意见稿。
MariaDB 采用指数的计算方法
以下是我们的 KPI 详细信息

各个 KPI 的权重显示在顶部的饼状图中。以下是我们如何选择它们的几点思考
- 采用类别的总权重为 40%:最真实的指标是正在运行的 MariaDB 数据库数量。由于无法获得此类数字,我们确定的次佳指标是来自 mariadb.org 的下载量(20%)、通过 Debian 的安装量(10%)以及 Docker 官方镜像的拉取量(10%)。不幸的是,Docker 镜像拉取统计数据在 2023 年底至 2024 年 9 月期间出现重大异常,因此我们决定从 2025 年 1 月起纳入 Docker 拉取量,对前几个月保持中立影响。
- 贡献类别的总权重为 19%。贡献数量是衡量开源项目健康状况的重要指标——因此该指数中的一个主要指标是外部贡献者每月创建的 PR 数量(5%)和独立贡献者的数量(5%)。此外,我们还关注总体受欢迎程度,包括 GitHub Star 数(3%)、在其他 GitHub 项目的 README 中提及 MariaDB 的次数(3%),以及 MariaDB Zulip 聊天中的新用户数量(3%)。
- 外部类别占比 20%,衡量 MariaDB 在 Google Trends 上的表现(5%)、所有语言的维基百科文章浏览量(5%) 以及涵盖多个指标的 DB Engines 排名分数(10%)。
- 开发者网络占比 9%,代表开发者常用的论坛:Reddit、Hackernews 和 Stackexchange,其中关于 MariaDB 的讨论表明了开发者对 MariaDB 的活跃程度。
- 社交媒体的总权重为 12%,概述了关于 MariaDB 的帖子触达开发者、决策者、用户和其他相关方的效果。我们关注 LinkedIn、Youtube、Fosstodon、Instagram 和 X 上的关注者/订阅者数量。
定义 MariaDB 采用指数时的挑战
我们努力仅使用公开可获取的数字。例如,YouTube 内容观看次数只有账户管理员才能看到,而 YouTube 频道关注者是公开数字。
在 KPI 的选择上有许多看似微不足道的选择。我们是关注月度变化量还是累计数量?是关注关注者/订阅者数量而不是实际的展示次数或观看次数?我们尽量做出了合理的选择。
有些看似基础的数字也存在挑战,例如 Docker 官方镜像的拉取统计数据,我们发现 MariaDB(以及 MySQL 和 PostgreSQL)存在严重的异常。在 2023 年 10 月到 2024 年 10 月期间,由于 Docker 的技术更改导致镜像自动重新拉取,每月拉取量显示为正常水平的 4 倍甚至 5 倍。在尝试规范化这些数字后,我们决定在指数中从 2025 年 1 月开始计算 Docker 拉取量。
那么,我们做得怎么样?哪些地方应该调整或增加?请告诉我们!
未来计划:外部可复现性
我们获知了 Scarf 解决方案,它有助于收集开源项目的销售和市场情报。我们正在研究如何将其应用于 MariaDB。
虽然我们仍在迭代定义,但大部分工作是手动完成和/或基于 Google 表格。随着时间的推移,我们希望自动化数据收集并使其更加公开。想象一个 GitHub 仓库、curl、json 对象和一些 GitHub Actions。敬请关注!
回到我们 2025 年的六个目标
您可能还记得我在一月更新中介绍的 2025 年六个目标。
- 社区分析:了解我们的现状!
- 贡献:让 MariaDB 成为充满活力的开发者社区!
- 推广:向现有和潜在用户宣传以推动采用!
- 向量与人工智能:为 MariaDB Server 引入新用户!
- 让 MySQL 用户更轻松地使用 MariaDB!
- MariaDB 高校计划:使用 MariaDB 支持数据库教学!
虽然我们在二月份一直在努力实现所有这些目标,但我想重点强调最显著的成果——我们在推广方面的工作。
MariaDB 日在布鲁塞尔 FOSDEM 期间举行
布鲁塞尔 FOSDEM 期间的 MariaDB 日取得了成功,如博客文章 MariaDB Day Brussels Aftertaste 2025-02 中所述。一些细节如下:
- Nikita Malyavin, MariaDB / Sergei Golubchik, MariaDB, 当客户端和服务器相隔一个秒差距时
- Vicențiu Ciorbaru, MariaDB 基金会, 开启你的开源职业生涯:向 MariaDB 贡献的第一步
- Sergei Golubchik, MariaDB, 认识最新的 MariaDB 版本
- Otto Kekalainen, MariaDB 中服务器发起的即时故障转移
- Peter Zaitsev, Percona, MariaDB 11 中精彩绝伦的特性
- Kristian Nielsen, MariaDB 基金会, MariaDB 复制:易于使用还是易于滥用?
- Roman Nozdrin, MariaDB, 迈向新高度:探索 ColumnStore 的真正能力
- Sergei Golubchik, MariaDB, 了解 MariaDB 极速原生向量搜索
- Jags Ramnarayan, SkySQL, 使用 MariaDB 的 VectorDB 和 SkySQL 的 AI Agents 构建 GenAI 驱动的应用
- Diego Dupin, MariaDB, 启动加速器:在 MariaDB 中使用 LLM 的具体案例
其中几场演讲与其他目标相关——包括贡献、MariaDB 11.8 的核心向量特性,以及让 MySQL 用户更轻松地使用 MariaDB。
在 FOSDEM 之后,我在伦敦的 State of Open Con25 上就开放数据发表了一场演讲:通过用无偏的开放数据喂养 AI 巨龙来拯救世界。这里主要的 MariaDB 视角是 MariaDB Vector 作为喂养整体 AI 巨龙的工具。虽然标题有点夸张,但世界现状也确实如此—— 如果您能抽出十五分钟时间,可以听听演讲录音,它与幻灯片一起被合并到一篇链接自上方博客文章的 YouTube 视频中。
新版本发布 – 以及一篇 LTS 博客
二月是发布月。Ian Gilfillan 写了两篇发布公告:
在相关方面,我们分享了 MariaDB 11.8 是 LTS 版本的消息——它将在五月正式发布 (GA)。
外部观察
最后,这里是一些来自 Reddit、Medium 和其他地方关于 MariaDB 的值得注意的外部观察:
- 我用不同的数据集运行了一系列基准测试,MariaDB 在 Windows 11 工作站上的运行速度比 MySQL 快两倍以上。(Will the Farmer 的 Apache 日志: Maria-Benchmark)
- r/programming 2 月 25 日, Cafe Maria。一个完全在 MariaDB 中进行的函数式烹饪模拟游戏。
- r/mariadb 2025 年 2 月 13 日: 对于新项目,您选择 MariaDB 而非 MySQL 的主要原因是什么?
- Medium 2025 年 1 月: 为什么 Maria 离开了 MySQL:无人谈论的数据库戏剧 作者 Mehdi BAFDIL
您怎么看?
您怎么看?请与我们分享您的反馈!可以通过评论、Zulip 或电子邮件。