中国发布全球首个全景式碳排放核算大模型
中国发布全球首个全景式碳排放核算大模型
中新网北京4月8日电(记者孙自法)在气候变化正深刻重塑地球生态环境、广泛影响人类社会发展的背景下,如何科学、高效开展全球碳排放核算至关重要,备受关注。
4月8日,全球首个覆盖生产端、消费端及自然源的全景式碳排放核算系统——“磐石·禹衡碳核算大模型”(“磐石·禹衡”大模型)在上海正式发布,标志着中国在全球碳排放核算领域取得重大技术突破。
数据算法算力三层支撑
“磐石·禹衡”大模型由中国科学院上海高等研究院牵头打造,旨在破解传统碳核算面临的知识壁垒高、数据处理难、周期长、分辨率低等瓶颈问题,通过生成式人工智能(AI)重构碳核算领域范式,动态刻画全球碳流动与碳溯源,全面提升中国在全球气候治理中的科技话语权。

“磐石·禹衡大模型”整体思路介绍。中国科学院上海高等研究院供图
以中国科学院此前牵头开发的“磐石·科学基础大模型”为基座,“磐石·禹衡”大模型在技术架构上构建了数据、算法、算力三层支撑体系。
数据层以研究团队构建的八类自主数据集为核心,并通过与部门、行业的协同对接,实现数据高频更新与融合。
算法层以自主研发的多口径碳核算方法学为核心,开发了基于大语言模型的碳核算垂直领域智能体并实现多智能体协作,确保核算的完整性和精确性。
算力层通过构建高性能内部服务器集群并与外部算力中心协同,实现算力资源的全局优化与弹性供给。
据了解,“磐石·禹衡”之名,“磐石”来自坚如磐石的科学之基,“禹”源于“大禹治水”的远古东方智慧,“衡”则取其公平公正之意。
320亿参数+5个智能体
场景应用是体现大模型价值的关键所在。目前,“磐石·禹衡”大模型的服务界面,提供320亿参数的垂直领域大语言模型和智能数据库的对话接口与编程接口,开发具有特定功能的5个智能体,可以分别实现工业体系流程数字化模拟及优化、贸易碳转移核算、生命周期评价、自然源核算及不确定性分析。其中,生命周期评价智能体能够自主实现目标与范围确定、清单分析、核算和结果解析全流程,完成产品碳足迹自动化核算。
高质量数据集是智能数据库问答、检索增强生成、自然语言生成及分析验证能力建设的重要基础。“磐石·禹衡”大模型围绕自然语言查询、多库管理、智能混合检索和行业知识问答等应用需求,构建了内外部结合、多维覆盖的数据集体系。
其中,内部数据集聚焦生产端、消费端、自然源、碳溯源等关键业务场景,外部数据集涵盖法律法规、核算指南、行业知识及外部数据库等重要信息资源,目前累计汇聚了208 TB(太字节)多格式碳数据。依托统一的数据采集、清洗、治理、向量化处理和结构化组织机制,持续提升数据质量与知识利用效率,为碳数据智能查询、知识推理、辅助决策和场景应用提供了坚实的数据基础。
持续迭代贡献中国智慧
碳排放核算是国际气候履约的重要依据,是国际碳定价的重要基础,是做好碳达峰碳中和(“双碳”)工作的重要前提。