导读: 随着这些年业界对不断涌现的国产数据库产品呼声越来越高,国产数据库的进步有目共睹。尤其是随着数字金融及互联网在国内急速的发展,以及5G时代的来临,在数据量级业务复杂度方面,可以说中国的数据模式及全新的数据场景正在赶超全球。面对全新的业务需求,传统以Oracle为代表的产品逐步丧失了其固有优势,给数据库产业带来全新的挑战,同时也是全新的机遇。
如今国产数据库已逐步形成了百花齐放的格局,而作为致力于推广国产数据库的墨天轮平台,此次非常荣幸地邀请到了巨杉数据库(SequoiaDB)的资深产品总监萧少聪先生来和网友们一起探讨一下关于国产数据库的发展。我们也征集了一些与国产数据库相关的社会讨论度较高、网友较为关心的问题,希望从SequoiaDB的角度给大众一些不一样的更深层次的解读。
资深产品总监萧少聪
现任职于巨杉数据库,负责公司产品及技术生态发展工作。加入巨杉之前分别任职于阿里云、华为,担任过高级产品专家及产业营销专家的职位,同时也是PostgreSQL中文社区的创始人之一。
一、产品介绍
(一)产品优势和目标用户
萧少聪:巨杉数据库SequoiaDB成立于2011年,是国内新一代分布式数据库技术的引领者,早在2013年就发布了首个商用版本。在目标客户方面,巨杉聚焦于金融行业,我们深信金融客户对数据库的要求是行业公认的“高地”,获得金融行业的认同有利于产品在各行业的商业化落地,形成基于产品价值的商业化付费闭环,以此为基础我们可以为客户提供更优质、可持续发展的产品及服务。目前巨杉数据库在金融行业累计客户已经超过100家。
相比数据湖,「湖仓一体」能够支撑联机交易和联机分析的场景,弥补了Hadoop技术栈对于数据实时并发能力的不足。SequoiaDB可以同时提供与数据湖一样的多模数据类型原数据的存储及管理,提高开发和运维人员的效率,显著提升整体“人效”。
相比数据仓库,「湖仓一体」作为支持联机处理的统一数据底座,具备实时处理多引擎、多数据类型能力,能避免不同平台间的数据移动,大大降低数据处理的时间成本。企业可以对不同岗位的研发及业务人员开放自由查询分析能力,显著提升整体“能效”。
更多详细的细节可以关注巨杉数据库官网。
(二)目前取得的成绩
萧少聪:我认为巨杉数据库取得最大的成绩是获得了金融银行业客户持续的信赖。我们在超过100家金融机构的生产系统上线使用,其中,运行时间最长的系统已经超过7年,单集群数据达到1万2000亿行的数据规模,单集群最大存储容量超3.0PB,最大单集群数据节点达到300台。
在产品方面,我们获得了包括:STP序列时钟协议在内的一系列专利,更被Gartner收录在2017、2018、2019、2020多个数据库象限及大数据相关的国际权威调研报告。基于自研技术及面向企业级客户的2B发展战略,巨杉数据库获得了资本市场的高度认可,2020年10月获得了由中金资本领投的D轮融资。
(三)产品未来的规划
萧少聪:传统关系型数据库在核心交易等领域深耕了40多年,但大部分纯交易场景不论从数据量还是商业模式上都没有本质的变化,业务扩展空间也十分有限。而在企业数字化转型的过程中,企业会产生全新的业务需求及数据增量。相比传统关系型数据库,分布式数据库在提供ACID事务一致性能力的同时,拥有更灵活的扩展及多数据模型的处理能力。
因此,分布式数据库的星辰大海,绝不仅仅在于对传统关系型数据库的简单替换。如果只是为了使用及推广新技术,便进行固有架构的替换,将会面临极大的技术风险与挑战。因此巨杉数据库会基于「湖仓一体」架构,与客户在新应用、新架构中一起挖掘数字化转型的全新数据价值,我们认为只有这样才能突破固有框架,建立全新的分布式技术赛道,超越传统的架构边界。
二、Q & A
1、墨天轮: 如何看待“得DBA者得天下”这句话?
萧少聪:数据库行业的参与者有很多,不仅有DBA,还有大量的开发、测试、需求与产品人员等,每一个角色对于行业的发展来说都是不可或缺的。无论是DBA还是研发,大家都在解决企业对数据管理及应用的需求,期望协助企业更好地理解数据、用好数据。
因此我认为从数据库产品上看,“得企业长期需求者得天下”,我们需要更着重思考客户所在行业现在及未来的长期需求,与客户共同成长才能做出好产品。而DBA及研发是这一链条中重要的参与者,在管理及开发工具上要为他们提供更良好的操作体验。
2、墨天轮: 如何看待数据库开源?开源是否能带来直观的收益?
萧少聪:数据库开源当然不会是坏事,我曾经作为PostgreSQL中国社区的创始人从2011年开始推动中国社区的建设和发展。但开源能否带来直观的收益,这一点上我还是持保留态度的。
以我自己为例,通过开源社区得到了职业生涯的发展,获得了不错的收益,但是这并不直观。当年Red Hat发的衣服我保留至今,上面写着“Open Source to make the big money.”,但我深信Red Hat的成功不取决于开源,而是因为其产品的稳定,以及企业级用户愿意付费的支持服务。
因此,无论开源与否,我们要讨论的是一款产品是否有商业价值,我们应该看产品是否将资源投放到了其目标客户市场的长期需求上,“得企业长期需求者得天下”。
3、墨天轮:能否给正在学习或者将要学习国产数据库的伙伴们一点建议?
萧少聪:首先我想跳出“国产”这样的名词,实际上我们探讨的是“如何学习一个新的数据库”,我建议的是先对数据库进行动手的学习,选型后从外围到核心逐步采用,形成真实的经验。
学习一个新的数据库,最简单的是需要掌握如何使用SQL,学习安装、备份、恢复等指令外,还需巩固必要的数据库理论基础,否则就只能停留在使用表面。各厂商的文档都有对自家数据库架构的深度讲解,大家可以花些时间进行学习理解。
而新型数据库,就意味着新的架构,以巨杉数据库为例,由于我们是分布式架构,一般用户在线下较难部署学习。因此,我们在官网搭建了「巨杉学」的平台,大家可以通过在线学习来真正操作分布式数据库。通过这一平台,我们已经培训了10000名认证工程师,为业界培养了一大批分布式数据库的从业人员。
4、墨天轮:您认为数据库发展的难点在哪里以及巨杉是如何来解决这个问题的?
萧少聪:数据库产品是一场长跑,需要拼耐力。它的难点及瓶颈是对市场未来的发展是否有着深刻的洞察,即研发的产品是否符合行业客户的长期需求。当年的MySQL处于互联网时代中小型程序及网站快速兴起的背景,与php形成最佳搭配,大量降低程序员的开发难度,发展一时无量。它并没有在任何场景直接迁移及替代Oracle,实际上市场中比较成功的“去O”案例都是基于MySQL的新架构设计,在业务的新版本迭代中采用新的数据库而并非简单的数据迁移及拷贝。
巨杉所选择的发展路径,我认为与上述有异曲同工之处,分布式数据库的诞生首先是为了解决传统数据库不擅长的场景。因此,我们持续在客户全新的业务场景发力,与客户共建联机历史数据平台、联机数据中台、非结构化内容管理等平台,不少客户已经有超过100个不同的业务接入到巨杉数据库。我们积极参与到客户业务的建设进程中,针对客户问题提供最优解决方案,与客户共同成长。我们欣喜地看到,分布式数据库的应用领域几乎每年都会有大幅度扩展,正在成为支撑企业数字化转型中不可或缺的数据基础设施。
5、墨天轮:能否给国产数据库一些寄语以及您的展望
萧少聪:展望——未来已来,分布式技术已经为我国数据库业界打开大门;展望未来,我们期待中国数据库稳步走向世界,与全球技术融合。
寄语——期待与客户及行业同仁深耕数据沃土,提升数据价值,打造中国品牌的世界级产品。
——————————
数据库国产化&墨天轮独家专访第二期内容如上,欢迎各位朋友与我们交流、互动。下一期专访内容将于近期发布,请大家多多关注!更多内容也可点击墨天轮编辑部以及【数据库国产化 | 墨天轮独家专访】查看。
墨天轮,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。
关注官方公众号: 墨天轮、 墨天轮平台、墨天轮成长营、数据库国产化 、数据库资讯