数据编织之父:无畏于数据,方能在Agentic AI时代致胜

11月中旬,初冬的北京,西班牙国王费利佩六世的专机降落在北京,一场跨越亚欧大陆的外交盛事即将上演。

这无疑是两国政治经济交流的里程碑。在西班牙庞大的经贸代表团中,有一位商业领袖尤为引人瞩目,他不仅是西班牙科技力量的代表,更“掌握”着打开AI时代数据宝藏的“逻辑密钥”。他就是Angel Viña,Denodo公司创始人兼CEO,被业界誉为“数据编织之父” 。

西班牙国王费利佩六世与Denodo创始人兼CEO Angel Viña 西班牙国王费利佩六世与Denodo创始人兼CEO Angel Viña

Angel Viña的访华,正值中国数字经济到从“数字化”向“数智化”跃迁的关键阶段。随着中国《人工智能+行动计划》全面部署展开,AI大模型、AI 智能体加速部署到业务场景之中,数据–这个AI时代的燃料,却因为爆炸性增长而带来一系列全新的挑战,羁绊着企业数智化前进的脚步。

正如Angel Viña所言:“未来的数据管理,仅仅依靠数据湖等方案还远远不够,企业更加需要一张灵活、高效的数据‘管网’:数据编织。而Denodo公司愿意继续深耕中国市场,将先进的数据编织理念、技术和方案带到中国市场,与广大中国客户实现双赢。”

Agentic AI需要数据就绪

AI大模型正成为推动行业智能化变革的关键力量。但AI 大模型的落地与应用过程中,企业却面临着愈发复杂且棘手的数据挑战。

“随着企业与组织尝试部署与应用生成式AI和智能体AI,会发现最大的障碍源于数据就绪度,而非模型性能。”Angel Viña如是说。

具体来看,在经历过云计算、大数据等技术的发展之后,大部分企业的数据环境走向复杂化,数据分散化和碎片化成为常态,而AI技术对于数据量、数据管道和处理效率的要求大不相同,则进一步加剧企业数据环境的复杂性。

固然,针对企业愈发复杂的数据环境,市场中有包括数据湖、湖仓一体、NoSQL等解决方案,试图通过汇聚数据、减少数据管道流程等操作来为AI做好数据准备。但数据天然就具备‘重力效应’,数据移动成本高昂,湖仓一体等解决方案并不能根本性解决数据管理的核心挑战。相反,随着数据量持续增加,数据移动成本的大幅提升,湖仓一体等方案的短板愈发明显。

更加关键的是,如果仅仅依靠传统的数据管理,并不能解决数据实时性的问题。而当AI 大模型无法访问实时或者完整数据信息时,其生成的洞察往往不一致或已过时。尤其是随着AI 智能体开始大量涌现,其将在业务场景中具备自主性和施行决策,如果在数据层面没有缺乏清晰的业务含义或统一的定义时,AI 智能体将难以准确推理或解释其决策。

Angel Viña直言:“没有信任,AI 智能体的自主性就无法存在。”

因此,Agentic AI时代加速,企业加大AI投资和应用AI技术成大势所趋,其数智化转型战略中一道“必答题”就是做好数据管理。而数据编织将确保AI基于可信、良好治理的数据环境运行,让AI 智能体使用准确、最新且得到良好治理的数据,从而让AI投资全部价值得以全部实现。

数据编织,企业数智化转型的基石

“不是移动数据,而需要连接数据。”Angel Viña道出数据编织的核心思想。

Denodo是全球唯一一家无需复制、搬移数据, 即可实现所有数据管理功能的公司。作为欧洲新一代科技独角兽,Denodo深耕数据管理领域多年,是数据编织领域全球领导者,创始人Angel Viña更是凭借深刻的洞见和前瞻性的观点,在数据管理领域享誉业界。

Gartner将数据编织视为十大战略技术趋势之一。数据编织是一种数据架构模式,提供关于数据对象的设计、集成和部署的信息并使上述操作自动化,不受部署平台和架构方法的限制,其核心目的是实现更加敏捷、无缝的数据访问和数据集成,并在应用场景中实现自动化。

数据编织系统架构图

简单来说,数据编织在现有数据环境中建立一个逻辑层,屏蔽数据环境的复杂性,企业不需要移动或者复制数据,通过逻辑抽象层的元数据来直接访问各种数据源。可以说,数据编织就是企业构建逻辑化、统一化且可信的数据基础的关键,这对于成功应用生成式AI和AI智能体至关重要。

  • 数据编织采用逻辑数据架构(LogicalData Architecture),直接从分布式源系统连接并交付实时、受治理的数据,使得AI模型和智能体能够访问准确、最新的信息,同时避免了耗费成本的数据复制;
  • 其次,通过数据编织,企业可以实现高效交付实时、AI就绪的数据,确保每一个AI和智能体工作流都使用最新、可靠的数据,同时优化成本和性能;
  • 第三,数据编织可以建立一致的企业级语义层,超越单个BI或数据工具中零散的定义,确保人类和AI智能体都使用相同的业务含义来解释数据,从而为可解释和可信赖的AI创造必要的共享上下文。

数据编织的这些优势无疑在Agentic时代会释放出更大价值。例如,ChatBI正在流行,但它仍然依赖于存储在单个系统中的预聚合或静态数据,用户往往得到不完整或者过时的答案。而Denodo 数据编织方案则采用实时访问、语义一致性和内置治理的结合,兼具治理与安全策略,让用户可以安全、AI驱动的规模化数据消费,避免了传统ChatBI工具的劣势。

也许会有人认为,在现有数据环境上增加一个逻辑层,不仅会进一步增加数据环境的复杂性,而且会影响到各种数据服务的性能。对此,Angel Viña直言,在现有系统上增加逻辑数据层并不会导致延迟或者增加开销,“通过Denodo大量用户实践,通过Denodo平台构建逻辑层之后,很多用户的业务场景反而提升了数据服务的性能。”

Denodo的平台包括数据虚拟化引擎、执行引擎和优化器、增强版数据目录、主动元数据管理、DATAOPS及多元配置和基于AI的建议等核心组件。以数据虚拟化引擎为例,它是Denodo平台实现大幅领先的关键,通过下推处理(push-down processing)、缓存和聚合感知等智能查询优化技术,能够大幅领先传统数据湖或者数据仓库的方案;性能测试甚至显示,在多个数据源组合情况下,Denodo在某些查询的速度比其他方案高达数十倍甚至数百倍。

“Denodo 平台消除了持续复制和同步引起的瓶颈,实现数据的实时访问。更加关键的是,平台无缝适应现有的混合云或多云环境,对于基础设施没有特殊要求。”Angel Viña补充道:“数据编织方案更像是一个加速器,在保持效率、安全性和控制的同时,提供对所有企业数据的统一视图。”

深耕中国市场,与客户共赢

再好的AI 技术,如果数据没就绪,恰如巧妇难为无米之炊。

当前,随着数字经济多年的蓬勃发展,中国无疑成为了一个数据大国,数据规模持续增加,人工智能应用前景广阔,千行百业均在在全面且积极的拥抱AI技术。IDC《全球人工智能和生成式人工智能支出指南》就预测,到2029年,中国人工智能总投资规模将达1114亿美元,未来五年复合增长率为25.7%。

因此,数据编织有望获得越来越多中国用户的认可和使用。而作为数据编织领域全球领导者,Denodo公司也愿意持续深耕中国市场,将数据编织先进的理念、技术和方案带入中国市场,并结合中国市场的实际特点和需求,进行本地化的落地。

首先,自2019年进入中国市场,Denodo公司就重视对于中国本地市场和环境的兼容性和适配性。经过去两年持续的产品开发工作和本地化技术交流,Denodo除了支持全球主流产品和技术外,还广泛支持国内技术生态系统的产品和服务,例如适配阿里云、亚马逊云科技中国等云服务,支持MaxCompute、AnalyticDB、GaussDB等数据仓库以及OceanBase、PolarDB、ApsaraDB RDS、人大金仓Kingbase等国产数据库。

其次,Denodo的战略目标是中国企业实现其数据生态系统的现代化,尤其是高端制造电动汽车、绿色能源、工程建设、交通物流等行业,Denodo将与这些那些垂直领域的领导者合作,共同开发面向全球市场的解决方案。

第三,Denodo还将致力于通过与中国机构和大学(如国家数据局和清华大学等)合作,致力于数据编织理念、数据技术标准化的推广,以推动定义数据共享、语义统一和分布式数据计算的开放标准在全球规模内的协作。

“中国市场潜力巨大,Denodo计划长期发展,我们希望与中国用户实现双赢,让中国用户在AI时代无畏于数据(Fearless Data),掌握市场竞争的主动权。”Angel Viña最后表示道。

分享到: 更多

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注