分类存档:向量
我很荣幸在瑞典哥德堡的 foss-north 2025 会议上,获邀谈论“使用自己的数据通过 RAG 使 AI 透明化”。4 月 14 日在 Chalmers 大学,我向满屋子的听众分享了如何使用 MariaDB Vector 进行 AI RAG,并以一个关于使用生成式人工智能(GenAI)扩展维基百科编辑的用例开始。
使用 RAG 改进维基百科
我分享了一个来自我为非营利组织 Projekt Fredrika 使用生成式人工智能(GenAI)大规模编辑维基百科的经验示例。
…
我们很高兴周五与提交了 MariaDB AI RAG 黑客马拉松构思阶段申请的每个人进行了单独通话。
构思阶段的截止日期已于上周过去,我们很高兴地告诉大家,我们收到了几个很有前景的提交,包括创新赛道和集成赛道。创新赛道涉及使用 MariaDB Vector 的应用,比如 RAG;集成赛道则是将 MariaDB Vector 集成到现有框架中。
参与者从个人贡献者到企业团队都有。有些人已经有一些人工智能经验,有些人则是 RAG 的新手。
…
MariaDB AI RAG 黑客马拉松的构思阶段截止日期(三月底)即将来临。
到目前为止,我们收到了几个很棒的提交。其中一个关于结合知识图谱和大型语言模型(LLM),使用 MariaDB Vector 最近邻搜索。另一个是关于“高级上下文差异”,根据两个文本语料库的内容而非字面措辞来识别差异。
目前所有的提交都在创新赛道。我们尤其希望在集成赛道有更多提交 —— 将 MariaDB 集成到现有的框架中,例如 这些,或其他应用程序。
…
参加使用 MariaDB Vector 和 Python 进行的 AI RAG 黑客马拉松还剩一周!
获胜者将有机会在五月的 赫尔辛基 Python 见面会上进行演示,获得 MariaDB 基金会和 Open Ocean Capital 的表彰和宣传,以及来自芬兰 verkkokauppa.com 的奖品。
要参与,请组建一个团队(1-5 人),并在三月底前提交两个赛道之一的构思。然后您将有时间开发该构思,直到 5 月 5 日,之后在 5 月 27 日的见面会上进行展示。
- 集成赛道:在现有的开源项目或人工智能框架中启用 MariaDB Vector。
…
我们很高兴宣布与 MariaDB Vector 和 Python 合作举办一场黑客马拉松。由于我们正在向外拓展,让我们从头开始:
MariaDB,这个开源数据库为全球最苛刻的应用提供支持,从维基百科到全球金融机构。现在,MariaDB Vector 将人工智能就绪的向量搜索原生带入了开源数据库世界。MySQL 用户请注意:
我们的黑客马拉松是您探索 MariaDB Vector 和 Python 的人工智能可能性的机会。无论您是开发者、数据科学家还是人工智能爱好者,MariaDB 基金会邀请您构建创新的人工智能应用,争夺奖品,并展示您的作品。
…
确认您可能已经预料到的事情:MariaDB Server 11.8 将是一个长期支持版本。
现为发布候选版本 – 5 月份正式发布(GA)
以 MariaDB Vector 作为主要新特性,MariaDB 11.8 接替了一年前的上一代 LTS 版本 MariaDB 11.4。
截至目前,MariaDB 11.8 处于发布候选版本阶段,计划于 5 月份正式发布(GA)。
自 MariaDB 11.4 以来新增了许多特性
在上一代 LTS 版本 MariaDB 11.4 的基础上,MariaDB 11.8 增加了大约 60 个大小特性。在我们最近于 2025 年 2 月 1 日在布鲁塞尔举行的 MariaDB Day 活动中,MariaDB Corporation 首席架构师 Sergei Golubchik 概述了 11.8 版本。
…
我们不是读心术士,所以时不时会进行一些投票。投票本质上是定量的,所以仅仅提出正确的问题是不够的——我们在设计备选项时需要做一点读心术。
快速开发基于文本的 RAG 应用
我们的假设是,RAG 是基于向量数据库的流行应用,特别是基于文本的 RAG。我们在关于 MariaDB Vector 的会议演讲中(例如 2024 年 11 月 8 日在意大利南蒂罗尔博尔扎诺举行的第 24 届 SFSCON)强调了能够轻松开发人工智能应用,这些应用基于特定文本集合中的知识而非 LLM 的整体训练数据来回答用户提示的价值。
…