登录

记忆


分类

记忆

南加州大学的RobinJia教授团队给出了他们的答案:训练一组模型,把它们开源,让更多人有机会深入理解大模型记忆的本质。
文章

训练数据污染导致某些模型在各类权威基准测试(Benchmark)中得分虚高……但长期以来,由于难以精准控制训练数据集,探究大模型记忆的深层因果机制依然面临重重限制。
文章

从观察到主动干预,Hubble构建出模型记忆的“双面镜”
文章

在Hubble之前,学术界研究大模型记忆动态的标杆是Pythia,这是一组EleutherAI团队于2023年发布的模型套件,他们当时开源了训练数据和中间检查点,发布后便迅速成为研究大模型可解释性、记忆研究和基准设计的标准参考工具。
文章

投入100万美元算力,研究揭示大模型记忆效应
文章

其次是时序效应(TimingEffects),“早出场,早遗忘”,数据暴露的时序会对模型的记忆能力产生影响。
文章

基于严密的受控实验,该研究揭示了大模型记忆机制的两大效应。
文章

结果发现,层数越深的模型记忆能力越强。
文章

他们不是来看热闹,而是真的要买这些油画,买那些关于逝去的乡村记忆
文章

彼时的赵江,身份格外特殊:曾是射洪县电视台记者,忙里偷闲拉着朋友自筹资金,拍了《轿顶山的孩子》《不得不走》两部小电影,不为赚钱,只为留住乡村记忆—看不下去留守儿童趴在门槛写作业,看不下去百年老院日渐坍塌。
文章

缓存

而「记忆缓存(MC)」则解锁了介于两者之间的新形态:将成组Token压缩并缓存到长期记忆状态中,然后在需要时进行检索。
文章

研究

探针伸进大模型黑箱,南加州大学华人团队打造AI记忆研究的深空望远镜2026年04月14日15:41DeepTech深科技来源:DeepTech深科技
文章

效应