登录

CogAgent-9B


描述

CogAgent-9B是基于GLM-4V-9B训练而成的专用Agent任务模型,能够仅通过屏幕截图作为输入,根据用户指定的任意任务结合历史操作,预测下一步的GUI操作。
文章

分类

CogAgent-9B

智谱AI旗下的GLM-PC基座模型CogAgent-9B现已开源,以促进大模型Agent生态的发展。
文章

智谱A​I开源Agent任务模型CogAgent-9B:通过屏幕截图预判操作2024-12-2709:16·
文章

事件

2023-12-27

与2023年12月开源的 第一 版CogAgent模型相比,CogAgent-9B-20241220在GUI感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均有显著提升,并支持中英文双语的屏幕截图和语言交互
文章

效果

智谱AI旗下的GLM-PC基座模型CogAgent-9B现已开源,以促进大模型Agent生态的发展。
文章