阿里李飞飞:在云计算时代,云原生数据库变得越来越重要

本文转自:雷锋网
阿里李飞飞:在云计算时代,云原生数据库变得越来越重要
文章图片

文章图片

编译|Ailleurs
作者|陈彩娴
李飞飞 , 阿里巴巴集团副总裁、阿里云数据库产品事业部负责人 , 也是达摩院的数据库首席科学家 , 任达摩院数据库和存储研究实验室的主任 。他在加入阿里巴巴之前是犹他大学计算学院的教授 。他的研究兴趣包括数据库系统、大规模数据管理、数据安全、数据分析以及用于系统性能和监控的机器学习方法 。同时 , 他还是ACM Transactions on Database Systems(ACM TODS)期刊的副主编 , 曾多次担任ACM SIGMOD和ACM SIGKDD的高级区域主席 , 并担任过各种领导角色(如总联合主席)和多个ACM SIGMOD会议的项目委员会成员 。
近日 , ACM对李飞飞进行了一次访谈 , 内容主要涉及李飞飞团队在阿里巴巴云基础建设方面的目标规划、云原生数据库系统的运用、对漫游连接算法的介绍 , 以及机器学习技术在电子商务中的巨大影响 。最后 , 李飞飞还谈到了他关于学界与业界工作差异的感悟 。
本文将采访编译如下:
ACM:作为阿里巴巴数据库首席科学家 , 您关于公司云基础设施建设的总体目标是什么?
李飞飞:我们团队的主要目标是为阿里巴巴自身的业务运营和阿里云上企业客户构建尖端的、世界级的云原生数据库系统 , 例如我们的云原生关系型数据库PolarDB和云原生数据仓库AnalyticDB(ADB) 。
在云计算时代 , 由于对弹性、高可用性、可扩展性的需求以及来自不同业务领域的应用程序对按需使用的需求增长 , 云原生数据库变得越来越重要 。云应用程序的这些需求为云原生数据库提供了新的机会 , 而传统的企业内部数据库系统无法完全满足这些需求 。通过探索共享存储和完全共享的架构(shared-everything architecture) , 云原生数据库利用底层云基础设施提供的资源池 , 将计算与存储分离 , 从而获得了出色的弹性和高可用性 。对于要求水平扩展的高并发工作负载 , 云原生数据库可以进一步利用一个无共享层(shared-nothing layer)来提供分布式查询和事务处理能力 。我们的最终目标 , 为我们的业务运营和云客户提供经济高效、易于使用且高度可靠的数据库服务 。
ACM:在阿里巴巴双11全球购物节期间 , 该网站的流量在几秒钟内可激增150倍 。您的团队开发了哪些工具来处理这类网站流量波动?您如何看待这些技术在将来的发展趋势?
李飞飞:如上所述 , 在应对这样的应用场景时 , 成功的关键是通过底层数据库系统产生极高的弹性和高可用性 。一眨眼间 , 流量就会突然激增 , 可操作的数据库系统必须以经济高效的方式来抵御这种海啸般的「袭击」 。对于一个典型的、传统的本地数据库系统来说 , 必须要提前提供大量的硬件资源 , 以满足峰值时的工作负载 。而一旦高峰流量在短时间内减少 , 就可能会导致成本高昂和资源浪费 。
相比之下 , 云原生数据库系统能够通过探索共享存储和完全共享的架构 , 以按需的方式来进行自适应地、弹性地分配和释放资源 。计算和存储的解耦 , 以及各种资源(计算机和存储资源)的共享 , 使得云原生数据库系统具有自适应性 。我们还利用分布式查询和事务处理 , 通过水平分区来提供进一步的可伸缩性 , 从而满足高并发性的需求 。
此外 , Raft或Paxos等分布式共识协议得到了扩展和增强 , 使得可用区(available zone , AZ)内部和可用区之间都具有高可用性 , 从而可以在不担心数据丢失和业务停机或中断的情况下处理任何故障 。同时 , 利用软硬件协同设计来探索RDMA、NVMe等新硬件和DPDK等内核旁路协议所具有的加速和优化作用 。