数据库“百亿蓝海”中,每位玩家都能找到一叶扁舟
融合、云原生是最近几年数据库和大数据技术从业者谈及最多的两个关键词。
在过去五年到十年间,以 MySQL、PostgreSQL、Oracle 为代表的 OLTP 数据库,以 GreenPlum、ClickHouse 等为代表的 OLAP 数据库,以及以 Hadoop 为一派的大数据技术三者的应用场景和相互之间的边界非常清晰。但是最近几年,“融合”越来越多地出现在人们视野中。
比如,OLTP 数据库和 OLAP 数据库的边界变得模糊,出现了 HTAP 这样的数据库,而一些新型的数据仓库的技术又与一些实时流处理技术相融合,出现了批流融合等这些新的数据库设计理念。当然,大数据和数据仓库融合的湖仓一体 Lakehouse 架构最近也激起业界的广泛讨论。我们今天所面对的数据种类和数据技术也更加复杂、多元。
本期 C 位面对面,我们有幸邀请到了矩阵起源创始人 &CEO 王龙。他曾在腾讯云担任副总裁,对数据库有着独特的见解和洞察。面对融合、云原生、异构等数据库技术趋势,他的选择是什么?到底什么样的数据库产品是真正适应市场需求且充满生命力的?数据库行业的诸多痛点又该如何解决?
00:00
/
00:00
倍速
点击画面,查看详情广告剩余: 55秒
1
创办矩阵起源,这是个值得博一回的时代
云计算、物联网、5G、AI 和元宇宙等概念的兴起打开了创新数据的大门,新场景、新应用以及新基础设施的出现总会对数据库产生新的需求,这些新需求推动着数据库及数据管理系统不断更新、迭代、持续向前。
2022 年,当我们再谈及“数据”一词时已不再仅仅是以 Hadoop 为长期代表的大数据概念了,而是充满无限可能的“新数据”。
狭义上讲,新数据是指两种类型的数据,一种是新的应用、新的场景下产生的与以往数据结构不同的新数据类型;另一种是指新增数据,就是数据结构还和过去一样,只是数据量级上有了明显区别。
广义上讲,数据越来越成为企业数字化转型的核心生产资料。如果仅仅以数据类型(结构化 / 半结构化 / 非结构化)、数据规模(MB/GB/TB/PB/EB)和数据用途来描述数据,已经无法合理高效的存储、处理和使用数据了。随着物理世界数字化进程的加速,这一问题变得更加突出。新的数据需要“新”的定义方式,数据生命周期各个阶段(采集、存储、传输、处理) 最重要的数据特点需要被统一描述和管理起来。例如不同阶段数据成分的差异、不同阶段数据结构的差异、数据和不同业务系统交互需求的差异,这些都需要以全新的方式来对待。类似于很多编程语言的“泛型”概念,“泛数据”也许会成为未来数据的新定义方式。
这样的新需求也必将带来新的创业机遇,在 IT 领域从业近二十年的王龙深知这一点。用他的话说,“天时、地利、人和都凑齐了,是时候博一回了。”
从行业和技术发展层面来讲,一方面,由于智能物联网、无人驾驶、数字孪生、元宇宙等新场景的不断涌现,IT 应用技术又走到了一个新的历史拐点上。另一方面,现有数据库逐渐无法满足公有云、分布式云、私有云等基础设施和 GPU、CPU、ARM 异构计算等技术的迅猛发展,是时候去建设下一代数据库和数据管理系统来应对这些新挑战了。这是天时因素。
从国家政策层面来讲有两个导向性政策非常关键。其一,我国很早就提出了《中国制造 2025》战略,将“智能制造”定位成中国制造业转型的主攻方向。同时也在不断鼓励各行各业拥抱数字孪生、产业互联网的新趋势,加速数字化转型和智能化升级。这是一个不同于之前消费互联网的领域,存在巨大的新机会,中国有着得天独厚的条件和机遇。其二,信创从提出至今,已经进入了推广期,需要自主可控且技术创新型的产品来面对数字化不断加速的各行各业。例如金融行业从 2021 年开始进入了信创的元年。这是地利因素。
从人才和意识层面来讲,我国的 IT 产业在经过了数十年的发展后,已经积累了大量的专业人才和核心技术,而王龙本人在大数据圈子里摸爬滚打了十数年后,对于技术、客户需求以及市场的理解也达到了一个新的高度。这是人和因素。
故变则生事,事则生谋。就这样,2020 年 11 月,王龙从腾讯离职,并在几个月后创办了矩阵起源。作为一个超级“懒”人和极简风格的爱好者,从一开始,王龙对矩阵起源产品的价值主张就十分明确,要简单敏捷、要开箱即用。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本文禁止转载,侵权必究。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)