美机构评估中国顶尖大模型:有成本优势,但与美存在8个月技术差距
2026年05月05日 21:47
◎ 科技日报记者 胡定坤
当地时间5月1日,美国商务部直属机构——美国国家标准与技术研究院(NIST)下属的人工智能标准与创新中心(CAISI)发布对我国DeepSeek V4大模型的评估结果。评估认为, DeepSeek V4比美国技术更具成本优势,但能力相差8个月。
CAISI测试了DeepSeek V4在网络安全、软件工程、自然科学、抽象推理和数学等领域的能力,结果包括: DeepSeek V4是迄今为止CAISI评估过的最强大的中国人工智能(AI)模型。 DeepSeek V4的实际性能与美国8个月前发布的GPT-5类似。与美国性价比最高的GPT-5.4 mini相比,DeepSeek V4在7项基准测试中的5项上成本更低。
此外,CAISI还发布了一张中美最强模型总体能力随时间的推移图,暗示中美AI技术差距日益扩大。不过, 有多家专业科技媒体对CAISI的评估结果表示质疑。 AI领域新闻网站The Decoder发文称,CAISI的评估很可能带有自身的政治目的。人工智能、比特币新闻网站Decrypt则援引了人工智能分析(Artificial Analysis)公司的评估结果。该公司评估认为,DeepSeek和OpenAI顶尖模型的差距实际上正在缩小。
来源 :科技日报 封面图来自视觉中国
编辑:郭炘蔚
主题:模型|DeepSeekV4|评估结果