进入2024年,CDM市场又迎来高光时刻。
先有Cohesity上演“蛇吞象”并购Veritas数据备份与数据管理业务,并在新一轮融资中获得IBM、NVIDIA两大巨头的战略投资;后有Rubrik获得资本市场认可,以64亿美元市值成功登陆纽交所。两大CDM明星厂商均收获极高的市场关注。
仔细研究,CDM市场风起云涌、波澜再起的背后离不开一条主线:即CDM终于成为市场大流,借助AI的东风,CDM平台不仅将成为各行各业最重要的数据平台,更有望彻底重塑数据备份与数据管理市场。
CDM终成市场大流
从“非主流”到“市场大流”,CDM见证了数据备份与数据管理市场近年来的万象更新。
众所周知,数据备份是一个横跨超过半个世纪的古老IT领域,早已形成固有的市场格局。从1990-2016年堪称CDM发展的史前时代,围绕备份数据的恢复与使用一直停留在“刀耕火种”的手工劳动阶段,数据准备和数据供给更是存在着大量“手工活儿”,效率和速度上差强人意。
2010年-2020年则步入CDM技术的创新时代。Acetifio第一个将CDM技术应用于企业备份业务,Delphix则是CDM应用于测试数据敏捷(TDM)的践行者。2016年,Gartner将CDM纳入存储与数据保护技术曲线,指出该技术是联系双模态IT的最佳纽带,具备广泛的应用外延空间。
2020年则是CDM发展的分水岭,CDM技术逐渐成长为时代的宠儿。Cohesity和Rubrik两大明星厂商于2020年进入Garnter备份魔力象限领导者,成长为CDM综合性平台厂商。
Cohesity并购Veritas获得大型企业数据中心的存量客户,形成CDM平台+大客户备份的杠铃式资产配置;甚至获得IBM & NVIDIA两大巨头的战略投资,进一步构成GenAI+CDM的战略格局。
Rubrik则得益于美国蓬勃的公有云市场,专注于CDM SaaS业务,通过Polaris平台整合数据保护、勒索行为防护等形成综合性的CDM服务,并于近期成功登陆纽交所上市。
如今,随着人工智能浪潮的到来,CDM技术迸发出前所未有的创新活力,并不断在市场中攻城略地,有望彻底重塑数据备份与数据管理市场。
CDM+AI:重塑备份市场
2024年,CDM领域一大标志性事件就是:Cohesity 4月份F轮融资战略投资者名单中赫然出现NVIDIA的名字。
Cohesity与NVIDIA走到一起,看似偶然,其实必然。这是因为大语言模型、生成式AI等AI技术正在深刻影响着各个领域,数据备份与数据管理也不例外,CDM+AI的技术融合已成为确定性趋势。
那么,CDM+AI的融合到底能够为数据备份、数据管理甚至生成式AI带来哪些显著的变化?我们可以从Cohesity 与NVIDIA在产品层面的深度集成中一见端倪。
首先,CDM+AI最先改变的就是数据备份与数据管理的本身。具体来看,CDM备份与管理时,通过引入AI自动识别,实现自动了解、识别数据资产,提升数据治理和构建原始格式数据湖的能力,真正让CDM成为企业构建数据资产体系中的关键一环。
更加重要的是,引入大语言模型和生成式AI,CDM环境中的数据备份、数据合规、数据安全和数据管理等一系列使用和交互方式也将彻底改变。
例如,Cohesity今年推出人工智能驱动的企业数据助手Gaia,将检索增强生成(RAG)AI与和大型语言模型(LLM)引入到企业备份数据环境中,用户可以根据其企业数据提出问题并获得答案,这将极大提升企业数据安全、数据合规和数据管理等方面的水平。
其次,CDM+AI会成为推动大模型、生成式AI等技术在千行百业中走向落地的关键组合。如果说人工智能时代中算力是“引擎”、数据是“燃料”,那么CDM就是众望所归的那副“油箱”,肩负起保存和输送“燃料”的重任。
众所周知,在当前大模型的训练中,数据与大模型结合主要有三种方式:检索增强生成(RAG)、微调和持续预训练。检索增强生成和微调两种模式都需要做数据清洗、数据治理等预处理工作,再通过ETL等繁重的流程之后将数据保存在数据仓库之中;而持续预训练则不需要做大多预处理,直接将原始数据提供给大模型训练即可。
再看目前主流的数据管理平台,传统数仓采取写时建模(Schema-on-Write)的模式,在AI大模型几无用武之地,只能起到局部优化的作用;而世俗意义的数据湖更多是为了弥补数仓能力不足的补充,更强调非结构化数据处理,真正能为AI提供有价值数据并不多。
相比于传统数仓和世俗意义的数据湖,基于CDM盘活的备份数据,完整包含了企业数据资产,可直接构建未经建模及清洗转换的原始格式的数据湖,通过Schema-on-Read 对备份数据湖快速训练AI大模型,可以低成本推进数据治理,同时减少数仓/中台的存储投资。
因此,CDM与AI大模型可谓是天作之合。目前来看,CDM+AI的组合会成为整个数据备份与数据管理的创新制高点。
事实上,CDM+AI的组合在市场中已有迹可循。Cohesity与NVIDIA共同宣布,NVIDIA NIM 微服务、 NVIDIA AI Enterprise 已经与Cohesity Gaia 平台完成产品层面的集成,形成强大的生成式AI解决方案。借助 NVIDIA NIM,使用Cohesity Gaia的客户将能够完成生成式 AI与备份存档数据的无缝对接。
可以预见,随着大模型等AI技术的崛起与应用,数据绝对不能“躺平”。传统数据备份的产品、理念和模式,已很难胜任AI应用的数据供给和数据管理的重任。而CDM与AI无缝衔接,将彻底打开AI应用的格局,有望成为最重要的数据平台,CDM+AI必然会彻底重塑整个数据备份与数据管理市场。
国内CDM:如火如荼进行中
与国外CDM在资本市场热火朝天相比,国内CDM在用户侧的市场热度丝毫不逊色。国内CDM首先在国内金融、制造、政务等重点行业实现破局,行业的头部企业针对传统数据备份的CDM升级替代正如火如荼进行中。
事实上,国内CDM也经历过相当长的蛰伏期。早在 2014年,Actifio就选择进入中国市场,带来先进的CDM理念和技术;2018年,Rubrik也紧随其后来到中国市场。但这两家国外CDM厂商不能适应中国大型企业数据中心高端备份的需求,最终以退出中国市场而失败告终。
不过,Rubrik们却在中国市场种下CDM的种子,影响了一批中国数据备份与数据管理的从业者,中国市场自此诞生多家CDM领域的创业公司,并逐步形成星星之火的燎原之势,有望在未来爆发。
事实上,任何一项技术的成功,都是市场环境、产品创新和用户需求多重因素持续互相影响的综合结果。
从市场环境层面,在发展数字经济、新质生产力的大趋势下,中国千行百业的数智化转型与升级正在全面展开,企业对于数据备份与数据服务日趋看重,这无疑为国内CDM发展带来一个长期看好的市场环境。
例如,IDC《中国副本数据管理CDM市场跟踪报告》报告显示,随着行业数字化转型的深入和数据量的激增,数据安全与业务稳定性、数据变现需求等需求持续提升,中国CDM近年来市场增速高于整体备份市场,连续几年保持大两位数的同比增长。
另外,国内CDM市场虽然还没有诞生出龙头厂商,但CDM初创厂商和备份厂商们这些年均在埋头苦干,投入到CDM技术研发之中,并在持续对CDM产品进行创新。甚至在金融、高端制造、能源、医疗、政务等行业中,国内CDM的产品已经获得了阶段性的应用与成功,
从行业需求来看,中国的金融、高端制造等大型企业,业务场景的复杂度、海量数据的规模度、对AI新技术的渴求度,以及私有云为主、公有云为辅的基础设施建设策略,决定了大型企业未来将全面拥抱CDM+AI的组合,彻底激发出国内CDM市场巨大的需求潜力。
综合观察,任何领域在AI时代都值得重新做一遍。作为数据领域重要的一部分,数据备份已然走过半个世纪有余。如今,随着AI时代的到来,与AI有着天然融合属性的CDM迎来了一次巨大的机遇。CDM+AI组合的兴起,将彻底改变数据备份市场,成为千行百业数智化转型与升级的坚实数据底座。