智能体迎来“行为准则”,图技术如何构筑AI安全治理的底层防线?
智能体迎来“行为准则”,图技术如何构筑AI安全治理的底层防线?
2026年05月15日 09:09
大语言模型的爆发让智能体加速走向产业应用,但在政务、金融、能源等高敏感领域,决策黑箱、不可解释、幻觉失控等内生缺陷,始终是摆在规模化落地面前的障碍。
在此背景下,近日,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》(以下简称《实施意见》),明确定义了智能体“自主感知、记忆、决策、交互与执行”的能力边界,更将“安全可控、规范有序”置于发展原则的核心。
与此同时,两项核心标准密集落地形成协同:《智能计算图计算性能测试方法》国家标准与《信息技术神经网络表示与模型压缩第3部分:图神经网络》国家标准密集落地,与新政同频共振,推动智能体安全治理迈入标准化、工程化新阶段。
当业界热议智能体将如何重塑千行百业时,一个技术命题亦被关注:即当具备自主决策与执行能力的智能体大规模融入网络空间与物理世界,如何确保其行为始终安全、可控、可解释?答案或许不在于智能体本身,而在于支撑其认知与决策的底层技术架构。
在这场关于智能体安全治理的“地基”建设中,图计算与图神经网络等认知智能技术,正展现出独特的支撑能力。
为智能体构建可解释的“认知护栏”
从行业趋势看,政策的出台指向了一个更深层的转向:AI领域的竞争重心,正在从单纯比拼模型参数规模,转向构建可控、可信、可落地的运行体系。业界将这一方向概括为“AI驾驭工程”( Harness Engineer)——即通过系统化的工程技术手段,确保AI系统在复杂场景下的行为可约束、过程可追溯、结果可验证。《实施意见》中强调的行为管控与内生安全要求,本质上正是对这一工程化方向的顶层呼应。
AI驾驭工程的核心命题,正是为智能体构建一套可解释、可追溯、可管控的“认知护栏”。当前以大规模语言模型为内核的智能体,虽然在交互与生成能力上表现突出,但其“黑箱”式决策逻辑和幻觉问题,构成了内生安全隐患。
当智能体从对话交互延伸到控制物理设备、操作金融账户等复杂场景,不可解释的行为可能带来真实世界风险。
《实施意见》强调的“完善技术底座”“明确产品准则”与“防范安全风险”,本质上指向一套能为智能体行为提供约束、验证与解释的基础设施。这正是图计算与图神经网络技术的核心能力所在。
事实上,图技术的优势在于天然擅长处理复杂关联关系,能够将现实世界中的实体(如人、账户、设备、政策条款)及其错综复杂的关系(如交易、归属、控制、因果),构建成可计算、可推理、可解释的知识网络。
图技术的独特优势在于对复杂关系网络的高效表达与推理,尤其适用于政务、金融、能源、制造等强关联场景。
从行业工程实践来看,以“知识图谱+大模型”的图模融合架构,正在成为AI驾驭工程落地的重要技术路线之一。 其核心逻辑是构建一个“双系统”协同机制:大模型负责广谱的交互理解与内容生成,而图技术构成的认知引擎则承担“逻辑校验器”与“事实核查员”的角色。当智能体需要做出决策时,其推理路径可以映射到图上进行实时校验。
例如,一个金融风控智能体决定拦截一笔交易,其决策理由不再是模糊的“模型认为有风险”,而是可以被解析为:“该交易对手,通过多层股权关联,最终指向一个位于高风险制裁名单上的实体,且资金链路与历史洗钱模式图谱高度匹配。”
这种基于关系网络的可解释性,是实现《实施意见》中“行为管控”与“内生安全”目标的关键技术路径。
标准落地提速,产学研协同推进
AI驾驭工程化落地,不仅需要技术路径,还需要标准化支撑。《实施意见》明确提出“构建标准协议”与“强化行业自律”。
标准体系的建立,是技术从实验室走向大规模产业化的关键环节,也是实现工程化治理的前提。在这一方向上,图神经网络与图计算的国家标准编制已率先落地——前者聚焦图神经网络技术本身的技术规范,后者确立图计算系统的性能度量体系,分别从“怎么做”和“怎么测”两个维度,为产业发展提供标准化底座。
两项标准由多家产学研机构协同完成:海致星图、蚂蚁科技集团、 百度 智能云、商汤科技等企业在图算法工程化方面提供产业经验;清华大学、北京大学等高校贡献理论支撑。
值得注意的是,能够同时在这两项核心标准中担任核心起草单位的企业寥寥无几。从公开信息来看,同时参与这两项标准制定的单位,仅有海致星图、北京大学、清华大学、北京邮电大学等六家核心产学研机构。
海致科技子公司海致星图是少数同时参与两项标准起草的企业之一。 其在图神经网络模型压缩、图计算性能测试两个领域的深厚技术积累,与该公司在政务、金融等高关联场景中多年的产业实践直接相关。
这标志着海致科技已将其在复杂关联数据处理、图算法优化及认知智能领域多年的实战经验,沉淀为行业通用的技术语言与规范,成为行业标准化与工程化治理的重要参与方,为产业发展提供可落地的参考样本。
具备规模化落地市场基础
《实施意见》提出的19个典型应用场景,覆盖科学研究、产业发展、民生福祉和社会治理等领域,均涉及高价值、高敏感度的关联数据。确保在这些场景中运行的智能体安全可控,不能仅依靠外部规则补丁,更需要内生安全机制。
技术路径的可行性,最终需要在产业落地中得到验证。
海致科技是图模融合路线在产业落地方面具有代表性的企业之一。其在“知识图谱+大模型”融合方向上的落地产品Atlas LLM平台,已通过国家级测评认证。海通国际报告显示,Atlas 智能体 2023 年开始贡献收入 0.09 亿元,2024 年快速升至 0.87 亿元,同比增长 872.2%;预计 2025–2027 年分别达到 1.46 亿元、2.64 亿元、4.73 亿元,同比增速分别为 68.4%、81.4%、79.0%。同期,智能体客户数预计从 2024 年 19 家提升至 2027 年 164 家,显示公司已从标杆验证迈向规模化复制。
目前,该平台已服务多家头部政企客户,其中包括在四家大型国有商业 银行 实现图数据库国产替代,并持续在零售营销、贷后管理等核心业务领域获得复购。此外,在粤港澳大湾区无人空间体系管理、城市交通隧道路网分析等新兴场景中,相关智能体应用也已实现订单落地。
这一系列商业化成果表明,基于图模融合的技术路线在满足安全可控要求的同时,具备了规模化落地的市场基础,并为行业提供了“标准适配+工程落地”的可参考样本。
未来,随着《实施意见》持续落地及相关标准完善,智能体安全治理将进入规模化落地的关键周期。 图模融合作为Harness驾驭工程落地的关键技术路径,正迎来规模化验证的重要窗口。
以海致科技为代表的企业,通过将图技术积累与产业实践相结合,推动技术迭代与标准共建,为 AI智能体 从概念试点走向核心业务应用提供了可行的技术路径。
无论技术路线如何演进,从“事后补救”转向“事前预判、事中干预”的治理理念,以及标准化、工程化的落地能力,都将成为AI产业从“能用”走向“可信、可靠”的重要 驱动力 。
(文章来源:财联社)