研究方向
  • OLTP(线上事务处理)与HTAP(线上混合事务与分析)引擎

在单节点架构下,通过共享存储和状态的技术手段,将数据存储到多个节点上以实现拓容和事务处理的单机向上拓展能力。在多节点集群架构上,通过分片的技术手段构建分布式数据库以实现事务处理的集群向外拓展能力,同时通过GTM来进行事务并发的调节和数据读写一致性的控制HTAP引擎则实现了在一份数据上同时进行事务处理和分析处理的能力。

  • 多模/多态,OLAP(实时在线分析)的NoSQL / NewSQL数据库系统

面对结构复杂而内容丰富的多模/多态数据,数据库系统需要对这类结构化,半结构化和非结构化数据进行融合分析,整合与清洗;实现结构化的特征提取和处理,需要不断提升的NoSQL / NewSQL以及实时在线分析系统的适用性,性能和效率。

  • 数据安全与数据库系统安全

在传统的访问控制,防止SQL注入等基础上,一个核心挑战是如何在不牺牲数据库系统性能的前提下提高系统的安全和数据安全保护能力。数据库系统需要不断提高加密数据查询与更新(利用同态加密等相关技术),不经意随机存取,查分隐私等一系列关键技术在安全性和系统效率之间的平衡能力。安全硬件的快速发展也为发展安全数据库系统带来了新的机遇,例如如何利用英特尔SGX这样的安全硬件来构建新型加密数据库系统。

  • 自治化与智能数据库

通过分析系统运行环境状态和日志数据信息,利用机器学习手段建模,来实现动态系统参数调整和系统优化,减少系统DBA的运维成本。在数据库系统查询与分析优化器的关键模块上运用这些技术可以实现从规则优化器和初级的性能优化器向高级的机器学习模型为主的高纬度查询优化器的演变。机器学习技术也可以帮助系统建立更加准确高效的在线预警与实时监测系统,来实现智能的DBA运维管控和资源调配。海量结构化,半结构化与非结构化数据的分析建模则提出了如何建立深度数据分析的智能数据库系统的科研问题。

  • 新硬件加速与数据存储

数据库系统需要研发CPU / GPU / FPGA异构计算体系的计算流程,在优化多核高并行的数据查询与分析任务时,必须要考虑系统硬件的体系结构(例如NUMA架构),来减少数据移动并实现数据为中心的查询和分析模式。例如NVM和RDMA课题。

  • 数据库核心算法

数据库系统设计中的各个方向和各个层面都会涉及到一些核心的算法挑战,例如并发控制,数据处理,系统调度,近似计算,非结构化数据分析和特征提取等。有效的解决这些问题需要将算法设计思想与数据库系统的系统运行状态和特征有机的结合考虑,这要求数据库系统的核心算法构建不断地接受新挑战和迭代变化的要求。


产品及应用
  • 国家气象大数据解决方案

    中国气象的气象大数据分析平台采用OLAP引擎的高吞吐实时入库和高并发读写支持并发复杂查询能力,基于聚集列实现单气象站历史数据毫秒级查询分析,存储从1957年建站以来6万气象站的分钟级数据,实现入库到应用展示分钟内业务目标。

  • 邮政/地产等行业解决方案

    万科和中国邮政通过使用分布式数据库水平扩展等核心能力,线性提升了整体数据库存储及计算容量处理能力,通过分布式事务处理引擎提供的数据库拆分能力,快速地支持二者核心业务系统迭代,大幅节省客户针对数据库层面的运维成本。

  • 国家重大项目技术支持

    支持公有云和专有云国家重大项目,例如上海城市大脑、国税等。


研究团队
李飞飞达摩院数据库与存储实验室负责人

犹他大学计算机系终身教授。曾获ACM、IEEE、Visa、Google、HP、华为等多个奖项,获IEEE ICDE 2014 10年最有影响力论文奖、ACM SIGMOD 2016最佳论文奖、ACM SIGMOD 2015最佳系统演示奖、IEEE ICDE 2004最佳论文奖、美国NSF Career Award、中国基金委海外重点研发奖,2018年ACM杰出科学家等。担任多个国际一流学术期刊和学术会议的编委、主席。

曹伟达摩院数据库与存储实验室资深技术专家

阿里云数据库团队负责人,计算机协会数据库专委会委员。在SIGMOD、VLDB、TSC等国际学术会议与期刊上发表多篇文章。研究领域包括分布式数据库与存储系统、大规模实时计算等。

吴结生达摩院数据库与存储实验室研究员

俄亥俄州立大学计算机博士学位。2014年加入阿里云西雅图,任职存储基础平台和云存储的负责人。曾就职于微软 Azure 存储团队 (2008-2014年), Ask.com 基础设施团队(2004-2008年)和中国科学院计算技术研究所(国家智能计算机研究开发中心,1996-1999年)。研究兴趣包括大规模分布式系统和大数据处理和分析系统等。

占超群达摩院数据库与存储实验室研究员

集团数据库事业部 OLAP Platform负责人,从无到有打造大规模在线云分析产品AnalyticDB、Data Lake Analytics,有多年海量数据分析平台的研发经验,先后担任多个阿里巴巴以及专有云大数据商业项目总架构师。

赵海平达摩院数据库与存储实验室研究员

纽约大学分子生物学硕士,普林斯顿大学计算机科学硕士。曾就职于微软公司,并先后在多家硅谷公司担任Server Architect,负责大型服务器架构设计。曾任职Facebook,创建Hip Hop项目。

张瑞达摩院数据库与存储实验室研究员

张瑞,2005年加入阿里巴巴数据库团队,现任阿里巴巴数据库事业部研究员,历经阿里数据库技术变革历程。他带领团队完成了数据库去IOE的变革,并完成了阿里数据库异地多活建设。作为双11数据库技术的负责人,为了满足双11极高的性能要求,我们在开源数据库上做了大量的改进和优化,形成了阿里开源数据库分支AliSQL。2017开始至今,致力于阿里新一代数据库技术体系的建设。

汪晟达摩院数据库与存储实验室Research Scientist

新加坡国立大学计算机博士。曾留校从事博士后研究。研究成果发表于VLDB等多个数据库及相关领域顶级会议。研究方向主要涉及大规模数据管理系统的设计与优化,包括分布式数据库,数据分析平台及区块链系统等。

扫描二维码
关注阿里技术微信公众号