终于来了:MariaDB Vector 预览版!

我们来了,我们是开源的,我们为您带来了基于 RDBMS 的向量搜索功能!随着 MariaDB 11.6 Vector Preview 的发布,MariaDB Server 生态系统终于可以体验期待已久的 MariaDB Server 向量搜索功能是如何工作的了。这项成果是 MariaDB plc、MariaDB Foundation 的员工以及贡献者(特别是来自 Amazon AWS 的贡献者)共同努力的结果。
MariaDB Vector 的前情提要
如果您对 Vector 不熟悉,以下是目前为止发生的事情
- 我们已经多次撰写博客,表达了我们对 Gen AI 在 MariaDB Server 中的位置的看法
- 我们在二月份的 FOSDEM Fringe Event 上展示了第一个演示
- 我们在 mariadb.org/projects/mariadb-vector/ 上启动了一个项目页面,其中包含许多视频
- 我们在伦敦的 Intel Vision 大会上登台演讲,主题是 AI 无处不在
- 我们撰写了关于亚马逊对 Vectors 和 MariaDB 看法的博客,题为“MariaDB 也将很快成为一个向量数据库”
重点:MariaDB Vector 已准备好进行实验
重点如下
- AI 和 LLMs 是关键,使用它们应该在一个“真实”、经典、熟悉的关系型数据库中进行——也就是存储其他数据的地方
- 我们的向量搜索实现基于行业标准 HNSW 算法
- 您可以开始尝试 AI 应用,由您喜爱的 AI 模型(OpenAI GPT-4、Claude、LLama2 等)生成的向量都可以存储在 MariaDB 中并进行搜索。
- 我们提供了用于轻松存储向量的语法(专用函数 VEC_ToText 和 VEC_FromText)
- 我们很快会撰写关于基准测试的博客,但早期迹象表明检索速度很快
- 所有 MariaDB Vector 的功能都在成为标准 MariaDB Server 一部分的路上
- 您可以开始尝试 AI 应用
- 您可以从 https://mariadb.org.cn/download/?p=mariadb&r=11.6.0+Vector 下载源码包
- 我们准备了一个特殊的容器镜像,在 quay.io/mariadb-foundation/mariadb-devel:11.6-vector-preview 启用了 CPU 优化
- 我们乐于接受贡献,并已准备好这样做
注意事项:它仍是 Alpha 版本
注意事项如下
- 我们谈论的是预览版(Preview),因此不提供完整的二进制包
- 我们谈论的是 Alpha 发布软件,这意味着它可能会崩溃
- 我们仍在扩展语法
- 我们计划在几个月内发布功能完整的 MariaDB 11.6 Vector Edition
- INSERT 速度仍需优化
- Knowledge Base 中的 Vector 文档仍在编写中
发布新功能总是在早期访问以获取早期反馈与成熟软件以保证测试有意义之间寻求平衡。考虑到二月份 FOSDEM 初次亮相后对测试的大量需求,我们不能再等了,必须尽快将其公开发布。
我们的 Vector 支持与 MySQL Server 相比如何?
我们与 MySQL Server 的 Vector 支持(称为 Heatwave)的不同之处在于,我们的向量搜索是开源的。事实上,与 MySQL 不同的是,我们目前仍然缺乏一个独立的向量数据类型,但在正式发布前会添加它。
我们的 Vector 支持与 Postgresql 相比如何?
我们与 PostgreSQL 的 Vector 支持(PG Vector)的不同之处在于,我们不仅致力于帮助 MariaDB Server 用户,也帮助 MySQL Server 用户轻松获得开源的向量功能。我们一直强调从 MySQL Server 迁移到 MariaDB Server 非常容易,而获得向量功能是开始迁移的一个绝佳理由。
我们与 PG Vector 的另一个不同之处在于,MariaDB Vector 不是一个插件,而是 MariaDB Server 核心的一部分。我们计划将 MariaDB 11.7 作为第一个包含向量功能的“普通”版本。
我们与 PG Vector 的相似之处在于我们对与贡献者合作的兴趣和能力。我们很高兴地注意到,首个版本的 MariaDB Vector 已经包含了重要的贡献,在此我想特别感谢来自 Amazon AWS 的 Hugo Wen 贡献的代码。与 AWS 的合作帮助我们改进了贡献和评审流程。
如何开始
- 下载容器:quay.io/mariadb-foundation/mariadb-devel:11.6-vector-preview
- 如何通过 Docker 安装和使用 MariaDB:https://mariadb.com/kb/en/installing-and-using-mariadb-via-docker/
- 下载源码包:https://mariadb.org.cn/download/?p=mariadb&r=11.6.0+Vector
- 项目页面:https://mariadb.org.cn/projects/mariadb-vector/
- 文档:https://mariadb.com/kb/en/vectors/
- 语法示例和配置技巧:https://mariadb.com/resources/blog/mariadb-vector-preview-is-out/