使用 MariaDB ColumnStore 构建关系型数据湖

本视频于2020年9月14日至20日在线举行的MariaDB Server Fest活动中发表。

问答链接

其他链接

摘要

为了向 VirtualHealth 的数据科学家和开发人员提供按需访问日益增加和复杂的去识别化患者数据,我们选择了关系型数据湖方法,其中日常 OLTP 数据快照可以保留其原始形式和格式。为了降低保持只读日常快照可用的成本,我们选择了 MariaDB ColumnStore,利用其固有的数据压缩能力。我们将介绍实际的分析用例,并分享我们学到的经验和技巧。

讲师

Sasha Vaniachine 是一位 MariaDB 爱好者,在解决整个软件堆栈中的可伸缩性问题方面经验丰富。在工业界和学术界,他将数据处理规模从太字节扩展到拍字节,同时将数据丢失降至可接受水平以下。在他的职业生涯早期,Sasha 开创了在虚拟机上部署 MySQL 数据库的先河。

日期和时间

  • 巴黎:9月16日星期三,16:10 – 16:35 CEST (UTC +2)
  • 纽约:9月17日星期四,15:35 – 16:00 / 下午 3:35 – 下午 4:00 EDT (UTC -4)