美机构评估中国顶尖大模型：有成本优势，但与美存在8个月技术差距

2026年05月05日 21:47

◎ 科技日报记者胡定坤

当地时间5月1日，美国商务部直属机构——美国国家标准与技术研究院（NIST）下属的人工智能标准与创新中心（CAISI）发布对我国DeepSeek V4大模型的评估结果。评估认为， DeepSeek V4比美国技术更具成本优势，但能力相差8个月。

CAISI测试了DeepSeek V4在网络安全、软件工程、自然科学、抽象推理和数学等领域的能力，结果包括： DeepSeek V4是迄今为止CAISI评估过的最强大的中国人工智能（AI）模型。 DeepSeek V4的实际性能与美国8个月前发布的GPT-5类似。与美国性价比最高的GPT-5.4 mini相比，DeepSeek V4在7项基准测试中的5项上成本更低。

此外，CAISI还发布了一张中美最强模型总体能力随时间的推移图，暗示中美AI技术差距日益扩大。不过，有多家专业科技媒体对CAISI的评估结果表示质疑。 AI领域新闻网站The Decoder发文称，CAISI的评估很可能带有自身的政治目的。人工智能、比特币新闻网站Decrypt则援引了人工智能分析（Artificial Analysis）公司的评估结果。该公司评估认为，DeepSeek和OpenAI顶尖模型的差距实际上正在缩小。

来源：科技日报封面图来自视觉中国

编辑：郭炘蔚

主题：模型|DeepSeekV4|评估结果