近年来,互联网正在以更快的速度,向着更能够表达人类思想、更类似于人脑思维构造的知识网络发展。知识网络数据规模大、来源丰富、类型复杂,如果继续用传统的关系型数据库来管理,用传统的数据计算方法来处理,会受到很大制约。图数据库作为一种全新的数据库类型,为解决这些问题提供了新的思路。

图数据库是以计算机科学领域中的图为基本模型和数据结构的数据库。由于具备优秀的表达能力、可视化效果和坚实的数学基础,图已经在物理、化学、生物、计算机科学等众多领域得到广泛应用。仅以计算机科学领域为例,图被用来表示通信网络、数据组织、计算流和数据流等,包括人工智能计算框架。相比传统的关系数据库,图数据库具有更善于处理数据之间的关系、更容易可视化展示和更充分满足多种实际场景需要的优点。

随着人类社会步入大数据时代,数据之间的关系变得越来越重要。作为承载数据资源的“容器”并能对外提供查询和分析能力的图数据库也变得愈发重要。当前,图数据库正在成为发达国家在数据库领域竞相布局的新兴热门领域,并已形成初步的市场规模,正处于快速发展之中。据预测,从2020年至2026年,全球图数据库市场的规模将以28.6%的年增长率增长。尽管在传统数据库时代,国外企业一直占据国内数据库市场的绝对份额,但在图数据库时代,我们有机会与国外企业同期起步。全球图数据库市场尚未定型,现在布局正当其时,我们要牢牢把握住这一难得的发展机遇。

如何在图数据库领域实现真正的突破?首先要坚持走自主创新之路,确保每一行代码都是安全可靠的;同时,政府部门的产业、税收政策和资金支持,要和社会资金、人力资源的投入共同发力,形成百花齐放春满园的局面;再者,要坚持应用拉动与创新驱动并重,走产学研结合的协同创新之路。通过应用引导学术研究的方向,确保科研成果快速转化为生产力;通过创新驱动完成技术的预研储备,培育并形成新的市场发展方向,确保技术的引领性和产品的竞争力。

令人欣喜的是,目前我国图数据库领域展现良好的上升势头。不仅华为、字节跳动等企业纷纷推出自研的图数据库产品,产学研深度合作也取得了新的突破。比如,清华大学与海致科技成立了高性能图计算院士专家工作站,联合推出的分布式图数据库产品已展露优异的特性,混合事务和分析处理、万亿级大图的亚秒级查询等性能目前都处于业界领先的技术水平。相信不久的将来,随着产学研用各方进一步形成合力,图数据库将实现从技术到产业的全面突破性发展,一个国产图数据库的时代一定会到来。

(郑纬民作者为中国工程院院士、清华大学计算机科学与技术系教授)