从数据大国到数据强国:数据“智理”为何不可或缺

在社会经济发展的历史长河中,每一次生产要素的变迁都决定着行业兴衰和企业沉浮。今天,数字经济的高速发展和人工智能变革浪潮到来,一个全新且重要的生产要素——数据,正以前所未有的速度和体量涌现,并深刻影响着每一个行业的未来。

中国无疑是一个“数据大国”,拥有最活跃的应用场景和爆发性增长的数据总量,人工智能应用前景广阔。但我们距离真正的“数据强国”,似乎还隔着一层无形的“天花板”:数据治理难题。尤其是《“数据要素×”三年行动计划》执行的深入,千行百业在数智化转型中,传统的数据治理方式方法难以为继,加速向“智理”进化成为大势所趋。

因此,从“治理”到“智理”是中国成为数据强国和行业数智化转型的必然路径。在2025第四届数据治理年会上,百分点科技率先发布业内首个深度聚焦数据治理领域的垂直大模型:百思数据治理大模型(BS-LM)和百思数据治理平台(AI-DG),全面开启数据的智能治理时代。

正如百分点科技CEO 苏萌博士所言:“未来的AI竞争中,比参数规模更重要的是场景深度。百思大模型将百分点科技过去十年沉淀的治理方法论‘产品化’,赋能行业和客户完成高质量、高效率、高价值的数据治理。”

数据治理演进到3.0阶段

IDC《2024中国数据治理解决方案市场追踪报告》(以下简称:《报告》)显示,2024年中国数据治理解决方案市场总规模达到3764.9亿人民币,同比增长率达到30.6%,未来几年将央国企、政务等客户还将继续保持数据治理的高投入。

无疑,数据治理乃行业未来数智化转型建设的刚需,其最大价值是让数据成为资产,并有效赋能业务创新和智能决策。但面对AI时代海量数据的敏捷需求,传统数据治理模式逐渐力不从心,甚至成为一项“包袱”,拖累企业数据要素价值的释放。

当前,传统数据治理模式主要存在:规则僵化、人工依赖重;语义割裂、协同困难;治理任务碎片化、难以自动化编排;知识难沉淀、治理难传承;规则驱动向智能驱动的转变缺位等突出挑战。

例如,治理规则和数据标准往往需要专家利用经验手工定义,使得数据治理周期长、适应性差,难以应对企业与组织日趋快速变化的业务需求。

众所周知,数据治理属于高度专业的领域,过去一直依赖数据治理专家的专业知识和实践经验。固然,数据治理近年来尝试融入AI技术,试图在功能中嵌入AI能力,推动数据质量识别、修复策略等功能走向AI化,但这基本属于点状的突破,依然很难解决治理全流程智能化不足、行业经验支撑不足、交互复杂、数据治理价值感低等问题。

因此,数据治理需要从“人工主导”加速向“AI自治”演进。百分点科技政企业务总经理马伟凯介绍:“数据治理1.0阶段主要是人工主导、平台赋能;2.0阶段则是功能AI化、降本增效。进入到3.0阶段,数据治理应该是AI原生治理,以大模型为内核、多智能体协作为载体,实现数据治理范式的跃迁。”

百思数据治理大模型:“智理”有解

“AI自治”,意味着数据治理范式从“分散化、规则驱动”走向“语义统一、智能驱动”。

这其中,数据治理大模型的应运而生成为必然。众所周知,通用大语言模型近年来取得持续突破,但也在垂直领域常陷入“知识肤浅、幻觉频发”的困境。虽然如此,通用大语言模型能力不断提升,为专注数据治理领域的大模型夯实重要基础。Gartner就预测,到2028年,企业中超过50%的生成式AI模型将为特定领域模型(DSLM)。

与通用大语言模型相比,数据治理大模型深度融合数据治理领域的知识体系和治理逻辑,具备数据治理领域的上下文理解能力,更加符合数据治理业务场景的推理与决策需求。数据治理大模型无疑是下一代数据治理体系的“核心引擎”,让数据“智理”真正有解。

如今,作为领先的数据智能企业,百分点科技率先出手,推出百思数据治理大模型,其基于百分点科技近千个数据治理项目经验与方法论沉淀打造,并深度融合DCMM、DAMA等国际国内权威数据治理框架和行业最佳实践。百思数据治理大模型具备数据治理知识的深度融合和专家级认知能力、全流程智能规划和闭环治理体系、治理资产构建与生成、场景化智能协同、治理成效精准度量和全面信创适配等能力特性。

以困扰垂直行业用户多年的数据治理流程规划为例,百思数据治理大模型可以基于用户战略目标与数据现状,自动生成涵盖规划设计、流程构建、资源调配的端到端治理方案,通过多行业场景知识库实现个性化匹配与动态优化。

马伟凯介绍,百思数据治理大模型采用“通用指令学习→领域增强→能力对齐”的多阶段训练策略,针对不同治理业务域分别构建多个具备深度专业能力的“领域专家模型”,并创新性提出数据治理“知识原语”理念,将复杂的数据治理知识体系解构为可计算、可组合的语义单元,构建了精准且可扩展的语义理解基础。

此外,百思大模型以“知识+推理”为核心,构建起覆盖数据治理全生命周期的智能能力体系,具备对治理逻辑、业务语义与合规要求的深度理解能力,形成“专家级”的行业认知,成为适用于垂直行业数据治理的智能决策引擎。

AI-DG:让“智理”高效执行

再好的数据治理规划,如果没有高效执行也将无法实现。

IDC在《报告》中强调,企业需要尽可能将数据治理与AI、Agentic相融合,实现流程自动化、智能化。众所周知,既懂业务和技术,又懂数据治理项目执行的专业人才目前依然稀缺,而智能体的涌现,则为数据治理的高效执行带来契机。

为此,百分点科技此次还推出以大模型为核心、多智能体协作为载体、AI自主工程化交付为目标的下一代数据治理平台:百思数据治理平台(AI-DG)。如果说百思数据治理大模型是一个智能决策引擎,那么AI-DG则相当于一个高效的执行引擎,能够将智能决策落实为具体的执行,从而完成数据“智理”的闭环。

百思数据治理平台采用“对话式治理”新模式,精准理解用户自然语言所描述的需求,并自动调度多智能体协同工作,完成数据探查、标准制定等全链路任务;同时,面对复杂治理任务时,专业智能体高度协同体系还能极大减少人工与重复劳动,并减少人工传递导致的碎片化问题;AI-DG的AI-Ready架构与智能体协同机制,还提供体系化与场景化双模式治理能力,既能完成全链路体系建设,又能解决特定场景的数据难题;多模态数据处理能力则能帮助用户构建统一治理体系,打破异构数据壁垒,实现多模态数据的标准化管理。

以非结构化数据治理为例,当前企业的数据治理工作大部分仍然以结构化数据或者少量知识文档为主,非结构化数据仅少部分被治理与利用。IDC《报告》认为,数据格式的界限正在模糊,打破数据形势之间的界限才能统一数据价值。

而百思数据治理平台所提供的多模态数据处理能力,打破文本与图像、音视频等非结构化数据的治理壁垒,自动提取实体、标签及语义关联,并实现跨模态联合分析,深度挖掘数据之间的潜在关系,为用户建立统一数据治理体系做好充足保障。

“从AI-DG的实践来看,用户的数据治理项目交付周期缩短70%以上,运营成本降低50%以上 。”马伟凯如是说。

事实上,针对政企对于数据安全与数据控的迫切需求,百思大模型与AI-DG实现全栈信创适配,深度兼容国产技术体系,构建“数据不出域、模型可审计、过程可追溯”的全链路安全保障体系,并支持本地化与私有云等灵活部署方案。

据悉,百分点科技后续还将持续推进数据治理AI Agent体系的建设,推动“规划-执行-评估-优化”的全自动自循环治理机制建设,并联合政务、应急等关键行业伙伴,共同推动数据治理生态的完善。

综合观察

数据要素已是无可争议的核心生产要素。

中国作为全球最大的数据圈,从数据大国到数据强国,需要的不仅仅是数据规模,更离不开数据的“智理”能力。随着我国《“数据要素×”三年行动计划》执行的深入,数据治理已成为企业与组织数智化转型的核心战略组成部分,企业对于数据治理的需求也将加速转向“智理”。

百思数据治理大模型的发布,标志着传统数据治理时代的徐徐落幕,全面融合Data+AI的数据“智理”新时代加速到来。面向未来,随着数据治理新范式的普及,政企等行业将不再为数据治理而困扰,数据价值的全面释放也必然让数字中国的蓝图加速照进现实。

分享到: 更多

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注