众所周知,生成式AI正在深刻影响着各行各业。但生成式AI的幻觉问题带来的挑战不可低估,也成为横跨在用户大面积采用生成式AI技术的一座难关。
如何降低生成式AI的幻觉现象,让生成式AI能够用起来和用好,就成为整个产业界为之努力的方向。
去年re:Invent 2024大会上,亚马逊云科技宣布推出Amazon Bedrock Guardrails——自动推理检查(Automated Reasoning checks)预览版,该功能基于亚马逊云科技核心云业务中长期使用,聚焦如何防止因模型幻觉而导致的事实性错误。
如今,自动推理检查(Automated Reasoning checks)已经正式上线,用户可以借助该功能实现生成式内容的“可验证”。
让生成式AI更可信
如今,生成式AI已经在办公、电商、医疗等多个场景中得到了应用。但不容忽视的就是生成式AI的幻觉现象,哪怕当下一众大模型能力不断迭代与提升,也无法彻底规避这一现象。
对于众多企业级用户而言,要想真正大面积的采用生成式AI,幻觉问题必须变得可控,也即生成内容需要在语法表达和事实表达的准确性上尽可能得高,同时还需要符合业务场景的真实逻辑。
当前,降低幻觉的主要方式是通过长上下文,甚至将原始文档提供给大模型,不过这种方式既考验大模型的内容提取准确性,又需要消耗大量Token,成本极高。
因此,亚马逊云科技的解决策略是在Amazon Bedrock Guardrails自动推理检查(Automated Reasoning checks)中符号主义思路。符号主义作为重要的人工智能流派,其核心策略是通过数学原理和逻辑算法将世界中各种描述抽象成严谨的逻辑表达,以确保生成的内容符合实际业务场景的真实逻辑。
据悉,亚马逊云科技Amazon Bedrock Guardrails自动推理检查(Automated Reasoning checks)功能可帮助客户依据其领域知识,来验证基础模型(FM)所生成内容的准确性,从而有助于避免因“幻觉”引发的事实性错误。
此外,自动推理检查(Automated Reasoning checks)还新增五大特性:
(1)可处理大型文档:支持在单次构建中处理大型文档,最多可达80K tokens长文档,能轻松处理海量文档资料,相当于多达100页的内容。
(2)简化策略验证流程:可保存验证测试并反复运行,便于随时间推移对策略进行维护和验证,让策略验证拥有类似“回归测试”的工程属性。
(3)自动场景生成:根据客户的定义自动创建测试场景,能降低使用门槛,节省时间和精力,有助于实现更全面的场景覆盖。
(4)增强的策略反馈:能够以自然语言的形式为策略变更提供建议,从而简化策略优化流程,让并非逻辑学专家的开发者和合规人员也能快速上手。
(5)可定制的验证设置:可根据具体需求调整置信度分数阈值,使企业对验证严格程度拥有更灵活的控制权。
显然,亚马逊云科技Amazon Bedrock Guardrails自动推理检查(Automated Reasoning checks)功能就像是给生成式内容加了一道“数学保险锁”,确保生成式AI不“偏离航道”。据悉,亚马逊云科技透露,自动推理检查(Automated Reasoning checks)功能的验证准确率高达99%,为消除“幻觉”方面能提供可验证的可靠性保障。

在亚马逊云科技官方博客上,亚马逊云科技以房贷审批场景,向大众演示了自动推理检查(Automated Reasoning checks)功能的实际应用情况:用户上传房贷审批规则文档,系统将其转化为逻辑定义,并自动生成测试场景。随后,用户可以补充手动测试,为每个用例设定预期结果,并运行验证。当输出与规则不一致时,系统能准确定位矛盾点,帮助用户调整策略。完成验证后,这些策略可直接应用到Guardrails中,用于约束AI助手的回答。

十年沉淀,亚马逊云科技的压箱底绝活
亚马逊云科技此次正式上线的自动推理检查(Automated Reasoning checks)功能,是亚马逊云科技内部打磨十多年、并大规模使用的能力。
例如,亚马逊云科技在Amazon S3、Amazon IAM、加密引擎等核心云服务中先应用自动推理(Automated Reasoning)。像Amazon S3的工程师每天都在使用自动推理来防止bug。Amazon S3拥有超过300个微服务,这些异常情况的潜在组合的数量是巨大的。这种复杂性促使亚马逊云科技的工程师们探索如何使用自动推理来探索可能隐藏在这些状态中的可能状态和错误。
如今,亚马逊云科技将压箱底的绝活正是推向前台,作为Amazon Bedrock Guardrails中的一项功能,供客户直接使用,并且广泛支持各种主流大模型。据悉,Amazon Bedrock Guardrails自动推理检查功能已经在美国、欧洲等多个可用区正式可用。
事实上,从亚马逊云科技的自动推理检查(Automated Reasoning checks)功能可以看出生成式AI加速落地的重要趋势:
其一、生成式AI技术是当前的热潮,获得了无数关注,但是AI不同技术流派的融合是重要的趋势,AI技术融合有助于发挥各自优势,从而更好地解决业务场景问题;
其二、包括生成式AI技术在内的AI技术普惠依然有着极大的实践空间,而云服务商因为业务场景规模巨大、复杂,其在自身业务场景的AI实践能够带来重要的思路,值得产业界学习与借鉴。
其三、鉴于AI技术的快速迭代,云依然是使用AI最佳的环境,像自动推理检查(Automated Reasoning checks)功能这种新功能,可以借助云让大量用户率先使用,无疑有助于加速AI技术的应用。
综合来看,随着自动推理检查(Automated Reasoning checks)上线,亚马逊云科技将帮助广大用户有效规避“幻觉”问题,这将极大提升用户对于采用生成式AI技术的信心。