ChatGPT, OpenAI 与 MariaDB Foundation

当所有人都(包括他们的祖母辈)都在谈论 ChatGPT 时,你就知道有大事发生了——一些意义非凡、超越常规 IT 圈子之外的大事。作为系列博文的第一篇,让我来思考一下 AI 对 MariaDB Server 用户意味着什么——或者至少,我们 MariaDB Foundation 目前能看到的潜在影响是什么。

AI 革命不可避免 …

专家们说,律师或程序员不会被 AI 取代——但他们**会**被使用 AI 的律师或程序员取代。我对此表示同意。

所以我们想要抓住这次令人兴奋的机会,确保 mariadb.org 博客的读者属于后一类人。

… 但它也令人兴奋!

因为**兴奋**,这就是我们对 AI 近期进步的整体感受!在多个专业领域尝试使用各种 LLM 模型后,我感觉自己就像七十年代末发现编程的小男孩。哇,你可以做到这个!噢,可能性无穷无尽!当然,自那时以来也有许多类似的兴奋点;噢,有比简单的 BASIC 和 Z80 汇编语言更具表现力的高级语言。啊,Focus 4GL!噢,Delphi。嗯,Python。噢,GUI。哇,开源。耶,互联网。嘿,Stack Overflow。这些只是我过去激动过的几件事。

AI 的历史表现不佳

直到现在,对我个人来说,AI 一直是令人失望的源泉。**Level 5** 是九十年代初由制作 Focus 4GL 的同一家公司提供的一个类似 AI 的工具;后来我又尝试了 AICorp 的 **KBMS**。结果令人失望,我学会了避开 AI,因为它总是过度承诺和交付不足。

那么,这意味着什么?

考虑到所有的媒体报道,几乎无需证明为什么 OpenAI 和 ChatGPT 现在让我如此兴奋。所以让我来详细阐述其后果。或者更确切地说,让我提出问题:*MariaDB Foundation 应该如何应对这个令人印象深刻且高效的 AI 新世界?*

我们抓住 AI 浪潮的三种方式

我们看到抓住 AI 浪潮的三种方式:

1. 提高我们自身的生产力

2. 提高 MariaDB Server 用户的生产力

3. 间接提高 AI 关于 MariaDB Server 回答的质量 

1. 提高我们自身的生产力

很有可能,我们自身的生产力并不是你高度关注的事。但这是我们赞助商关注的事,他们期望我们用有限的资源来完成开放性、采用和持续性的使命。因此,如果我们在不增加资源的情况下改进沟通(更高质量的博客文章!活动中更好的演示!改进的文档!),这将使 MariaDB Server 的最终用户受益。

同样非常重要的一点是:身体力行。如果我们自己不使用 ChatGPT、Bard 或 LaMDA,我们几乎无法帮助我们的用户群使用它们。 

2. 提高 MariaDB Server 用户的生产力

如果我们能帮助**你**使用 AI 来提高作为使用 MariaDB Server 的应用程序开发者的效率,或作为 DBA 的效率,那么我们就恰当地履行了我们的职责。

市面上有很多博客文章展示如何访问 OpenAI(例如通过 https://nat.dev/),所以我们更倾向于展示如何最好地使用 AI 来创建正确的 CREATE 语句。你如何使用 AI 来想出正确的初始数据库模式?如何将其转化为第三范式,或为了报表目的而去范式化?如何为其创建索引? 

或者,话说回来,AI 能否帮助你改进你的 SELECT 语句?选择正确的复制拓扑?找到合适的连接器?理解一个奇怪的错误消息? 

在所有上述情况下,我们可以为你进行实验。你的时间有限,所以不如我们花时间实验——然后与你分享结果?

3. 间接提高 AI 关于 MariaDB Server 回答的质量 

如果我是一个大型语言模型的设计者,我肯定会比普通博客文章更关注 Wikipedia 和 Wikidata。对于像 MariaDB Server 这样的产品,我会非常关注 https://mariadb.com/kb/ 上的 MariaDB 知识库——作为关于 MariaDB Server 的规范知识表示。根据我们目前的实验,这似乎确实是这样。

诚然,很难将 GPT 的输出与具体的知识点联系起来。尽管如此,随着我们的实验,我们了解得越来越多——这反过来意味着我们大致了解了 LLM 从哪里获取信息。有时信息源在 MariaDB Foundation 的直接控制下,那时我们就可以通过调整它来使其更易于 AI 模型访问。 

如果 AI 的回答包含关于 MariaDB Server 的错误信息,我们就遇到了问题。这是我们用户的问题。如果你得到了错误的建议,你又如何正确地使用我们的软件呢?

针对错误信息,我们可以做很多事情。我们可以向你强调错误信息,但这只能帮助阅读我们博客的人。理想情况下,我们希望尽快修正 AI 输出。重新训练模型。这可能会变得推测性,但在个别情况下,我们或许能够追踪错误信息可能的来源到某个外部网站,然后我们可以联系他们并提出修正错误的建议。 

这是否像是在大海里烧开水?抑或是杯水车薪?我们至少会尝试修正一些明显的误解,因为即使没有 AI、只有老式谷歌查询,高访问量网站上的错误信息也是个问题。

MariaDB Foundation 有一位常驻 AI 专家

MariaDB Foundation 有一位常驻 AI 专家,Vlad Bogolin。我随意定义的专家是指过去几年花时间使用或至少尝试过 AI 的人(所以我在九十年代的冒险不算数)。要具备这样的专家资格,仅仅玩过 Python 中的机器学习库是不够的。还需要尝试自然语言提示和图像生成。

Vlad 符合条件。他的思维方式因此更 attuned to 如何使用 LLM,而不是像我这样只是在 ChatGPT 发布后才开始尝试的人。这体现在他处理几乎任何问题的方式上。 

ChatGPT 建议我们的博客标题

几周前,我和 Vlad 聊了聊如何使用 ChatGPT。我们能写出更好、更快的博客文章吗?Vlad 说可以。但是,它们可以发表吗?Vlad 说,如果经过适当的审核,当然可以。好的,那我请他起草一些实验性的博客文章,他说没问题。  

但他更进一步,询问 ChatGPT 有什么博客文章的点子。他想出了五个标题:

  1. MariaDB 入门:初学者综合指南
  2. 理解 MariaDB 架构:深入探索
  3. 精通 MariaDB 索引以实现最佳性能
  4. MariaDB 安全最佳实践:保护你的数据
  5. MariaDB 性能调优:技巧和窍门

不错,即使这只是精选出的最好的一些。

我们的计划:一次一个领域,突出错误信息

现在,我们的计划是看看这些博客文章,然后请 ChatGPT 来写。然后由我们来突出错误信息。这与我们抓住 AI 浪潮的三种方式都吻合。首先,我们在更短的时间内为你创作更多内容。其次,更重要的是,我们帮助你提高工作效率。第三,我们了解 AI 误解的本质,并了解我们如何可能修正它们。

所以,敬请关注后续内容。我希望你和我一样,从这场令人兴奋的 AI 革命中获得并分享同样的小男孩(或小女孩)般的兴奋感!