登录

稠密注意力


分类

系统

检索pipelines、上下文压缩、递归拆解以及基于Agent的编排,都在提升稠密注意力系统的可用性,但没有改变其扩展定律。
文章

模型

在MRCRv2上,SubQ能够跟上前沿的稠密注意力模型;
文章

成本

稠密注意力的成本
文章

其它

在MRCRv2上,SubQ能够跟上前沿的稠密注意力模型;
文章