智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影

智东西7月29日报道,7月28日,世界人工智能大会WAIC 2025期间,在由中国信息通信研究院举办的“大模型智塑全球产业新秩序论坛”上,蚂蚁集团大模型安全解决方案“蚁天鉴”宣布升级,新增智能体(AI Agent)安全评测工具,具备Agent对齐、mcp安全扫描、智能体安全扫描、零信任防御等四大核心功能。

AI领域正从(cong)大模型时代(dai)迈(mai)向(xiang)智(zhi)能(neng)体时代(dai)。智(zhi)能(neng)体不仅具备(bei)对话生成能(neng)力,还拥有自(zi)主规划、跨领域推(tui)理,甚(shen)至能(neng)做出超(chao)越人类理解的决策,AI已进(jin)入“行动”阶段(duan)。然而,智(zhi)能(neng)体的越权、过度代(dai)理等问题也带来(lai)了安全挑(tiao)战。

数(shu)据(ju)显示(shi),超过70%的(de)智能体从业者(zhe)担忧AI幻(huan)觉与错误(wu)(wu)决策(ce)、数(shu)据(ju)泄露等问题,因为(wei)AI生(sheng)成的(de)内容往(wang)往(wang)包含(han)事实(shi)错误(wu)(wu),或者(zhe)对(dui)指令产生(sheng)误(wu)(wu)解,其中超半数(shu)受访者(zhe)表(biao)示(shi),所在企业尚未设立(li)明确的(de)智能体安(an)全(quan)负责人。

世界数字科(ke)学院(yuan)(WDTA)最新发布《AI智能体(ti)运(yun)行安全测试标准》提出将输(shu)入输(shu)出、大模(mo)型(xing)、RAG、记(ji)忆和工具五(wu)个关键链路与(yu)运(yun)行环(huan)境对应(ying)起来,分析智能体(ti)全链路风险。

“蚁天(tian)鉴”为蚂蚁集(ji)团联合(he)清华大学共同研发(fa)推(tui)出的大模型安全(quan)一体化解决方案,确保大模型技术在安全(quan)可靠(kao)的环境中发(fa)挥效能(neng)(neng),打造AI大模型的安全(quan)铠甲(jia)。“蚁天(tian)鉴”新增的智能(neng)(neng)体安全(quan)评测(ce)功能(neng)(neng),正(zheng)与WDTA标准(zhun)框(kuang)架契合(he)。

▲大模型安全(quan)解决方案“蚁天鉴(jian)”新(xin)增(zeng)智能(neng)体安全(quan)评测工具

据介绍,升级的“蚁天鉴”在Agent运行阶段,构建了一套智能体安全扫描系统,通(tong)过(guo)一系列专用(yong)工具(ju)(ju)来检(jian)测Agent可能面临的(de)安全风险,实现(xian)端到端扫描(miao),确保工具(ju)(ju)与Agent的(de)交互链路不(bu)被(bei)篡改(gai)或(huo)绕过(guo),为复杂(za)环(huan)境下的(de)稳(wen)定运(yun)行提供(gong)可验证的(de)安全基线。

目前,“蚁天鉴”的风险研判Agent准确率可以达到96%以上,并可支持11个行业的智能体测试

MCP安全扫描功能,是行业内首个对外发布的MCP安全(quan)扫(sao)描工具,可(ke)自(zi)动化识别AI工具集(ji)成(cheng)与数据交换链路中的安全(quan)漏洞及风险行为(wei),覆盖工具投毒(du)攻击、间接提示(shi)词注(zhu)入、恶意(yi)代码注(zhu)入等(deng)3大类共(gong)10项(xiang)子类风险。

此外,其Agent对齐功能集成了(le)高效工具调用、敏感双重验证、多通道(dao)恶意识别及沙盒环境(jing)训(xun)练,确保(bao)智能体的决策、行(xing)为与开发者预设目标(biao)、价值观及伦理道(dao)德保(bao)持一致(zhi)。

通过深度理解智能体服务上下文与风险情境,“蚁天鉴”还可对每一次调用进行内容、链路、行为、权限、组件、来源、身份七层校验,并依据策略引擎动态决策放行、降级或阻断,实现 “永不信任,始终验证”的零信任动态防御

“蚁(yi)天鉴”2.0在去年的(de)世界人工智能(neng)大(da)会上发布,形成(cheng)了包括大(da)模(mo)型基础设施测(ce)评(ping)(ping)、大(da)模(mo)型X光测(ce)评(ping)(ping)、应用安全(quan)(quan)测(ce)评(ping)(ping)、AIGC滥用检(jian)测(ce)、证(zheng)件伪造检(jian)测(ce)、围栏(lan)防御(yu)(yu)等在内的(de)完整技术链(lian)条(tiao),面向行业提(ti)供全(quan)(quan)方位智能(neng)化的(de)大(da)模(mo)型安全(quan)(quan)测(ce)评(ping)(ping)和防御(yu)(yu)解决方案。

蚂蚁集团机器(qi)智能(neng)(neng)部(bu)总经(jing)理、安(an)(an)(an)全(quan)实验(yan)室首(shou)席科学家(jia)王维强谈道:“升(sheng)级(ji)的‘蚁天(tian)鉴(jian)’基于‘以攻促防’的安(an)(an)(an)全(quan)理念,通过(guo)构建‘对齐-扫描-防御’技术栈,形成全(quan)流程(cheng)防护体系,从(cong)而为智能(neng)(neng)体提(ti)供风险扫描与(yu)实时防御能(neng)(neng)力,我们也将与(yu)行业共建,未来逐步开(kai)源(yuan)开(kai)放安(an)(an)(an)全(quan)工具。”