分类档案: 开发
我很高兴被接受在瑞典哥德堡的 foss-north 2025 上,就“使用您自己的数据通过 RAG 使 AI 透明化”发表演讲。4 月 14 日在查尔莫斯理工大学,我向满座的听众分享了如何使用 MariaDB Vector 实现 AI RAG,并以一个关于使用 GenAI 大规模编辑 Wikipedia 的用例作为开场。
使用 RAG 改进 Wikipedia
我分享了一个用例示例,来自于我为非营利组织 Projekt Fredrika 使用 GenAI 大规模编辑 Wikipedia 的经验。
…
我们在 MariaDB Catalogs 上取得了重大进展,尽管还有一些工作要做,但我们很高兴为社区提供一种简单的方式来试用我们的预览版本。您不再需要自己编译源代码——只需使用我们预构建的容器,现在可在我们的官方 quay.io 开发注册表中获取。
代码已在 Github 上公开可用,与官方 MariaDB Server 位于一个单独的仓库中(直到该功能作为官方 MariaDB Server 版本的一部分发布)
…
MariaDB 使用 Clang 的内存、地址和未定义行为 Sanitizer 来识别持续开发和测试过程中的编码缺陷。MariaDB 希望通过在线活动分享如何轻松执行相同的 Sanitizer 检查。
MemorySanitizer 环境特别难以创建。由于 MariaDB 使用基于容器的构建和测试,我们有一个任何人都可以重复使用的环境。
我们的“深度探讨”曾经是内部技能转移机制,但这是我们第一次将其开放给任何人参与。
本次深度探讨将涵盖
…
周五,我们很高兴与所有向 MariaDB AI RAG 黑客马拉松 想法阶段提交的人进行了单独通话。
想法阶段的截止日期已于上周过去,我们很高兴分享,我们在创新赛道和集成赛道都收到了几个有前途的提交。创新涉及使用 MariaDB Vector 的应用程序,如 RAG,而集成则是在现有框架中启用 MariaDB Vector。
参与者从个人贡献者到企业团队都有。有些人已经有一些 AI 经验,有些人则是 RAG 的新手。
…
MariaDB AI RAG 黑客马拉松的想法阶段截止日期即将来临(到三月底)。
到目前为止,我们收到了一些很棒的提交。其中一项是关于结合知识图谱和 LLMs,使用 MariaDB Vector 最近邻搜索。另一项是关于“高级上下文差异”,它不是根据文本的字面措辞,而是根据其内容来识别两个文本语料库之间的差异。
目前所有的提交都在创新赛道。我们特别欢迎集成赛道的提交 – 例如将 MariaDB 添加到 这些 框架或其他应用程序中。
…
距离参加使用 MariaDB Vector 和 Python 的 AI RAG 黑客马拉松还剩一周!
获胜者将在五月的 赫尔辛基 Python Meetup 上进行演示,获得 MariaDB Foundation 和 Open Ocean Capital 的认可与宣传,以及芬兰 verkkokauppa.com 提供的奖品。
要参与,请组建一个团队(1-5 人)并在三月底前为两个赛道中的一个提交想法。然后您有时间到 5 月 5 日来开发想法,Meetup 将于 5 月 27 日举行。
- 集成赛道:在现有开源项目或 AI 框架中启用 MariaDB Vector。
…