记忆
描述
从知识管理的角度看,记忆是连接历史经验与未来决策的桥梁。
文章
分类
记忆
ATM-Bench:系统评估AI长期个性化记忆能力的基准
文章
这说明,即便给AI配齐代码执行、文件搜索、索引构建等整套工具链,长期个性化记忆问答仍然是一个根本性难题。
文章
在那之前,也许我们不该对智能体的记忆能力期待太高,毕竟,它们连「去年给妈妈买的相机」都记不住,OpenClaw、Codex、ClaudeCode都不行。
文章
最近,来自剑桥大学的团队开源了面向AI个人助理的长期记忆基准测试ATM-Bench。
文章
ATM-Bench的实验结果虽然「惨淡」,但作者团队相信这为未来的长期记忆机制与个性化AI助手的研究开辟了新的方向。
文章
ClaudeCode+Opus4.6作为编程智能体的标杆,也只有33.8%,尽管明显优于多数专用记忆系统,但仍难以胜任真实长期记忆QA;
文章
南加州大学的RobinJia教授团队给出了他们的答案:训练一组模型,把它们开源,让更多人有机会深入理解大模型记忆的本质。
文章
训练数据污染导致某些模型在各类权威基准测试(Benchmark)中得分虚高……但长期以来,由于难以精准控制训练数据集,探究大模型记忆的深层因果机制依然面临重重限制。
文章
从观察到主动干预,Hubble构建出模型记忆的“双面镜”
文章
在Hubble之前,学术界研究大模型记忆动态的标杆是Pythia,这是一组EleutherAI团队于2023年发布的模型套件,他们当时开源了训练数据和中间检查点,发布后便迅速成为研究大模型可解释性、记忆研究和基准设计的标准参考工具。
文章
投入100万美元算力,研究揭示大模型记忆效应
文章
其次是时序效应(TimingEffects),“早出场,早遗忘”,数据暴露的时序会对模型的记忆能力产生影响。
文章
基于严密的受控实验,该研究揭示了大模型记忆机制的两大效应。
文章
他们不是来看热闹,而是真的要买这些油画,买那些关于逝去的乡村记忆。
文章
剑桥发布长期个性化记忆基准ATM-Bench
文章
剑桥发布长期个性化记忆基准ATM你的「龙虾」真记得你吗?
文章
彼时的赵江,身份格外特殊:曾是射洪县电视台记者,忙里偷闲拉着朋友自筹资金,拍了《轿顶山的孩子》《不得不走》两部小电影,不为赚钱,只为留住乡村记忆—看不下去留守儿童趴在门槛写作业,看不下去百年老院日渐坍塌。
文章
缓存
而「记忆缓存(MC)」则解锁了介于两者之间的新形态:将成组Token压缩并缓存到长期记忆状态中,然后在需要时进行检索。
文章
系统
多个国家的数据保护机构已开始发布专门针对AIAgent记忆系统的数据安全技术指南。
文章
研究
探针伸进大模型黑箱,南加州大学华人团队打造AI记忆研究的深空望远镜2026年04月14日15:41DeepTech深科技来源:DeepTech深科技
文章
效应
归属权
云端AI的“个性化”本质是在别人的服务器上构建你的数字画像,记忆的归属权不在用户手中
文章
当AI记住了你的工作习惯、健康状况、家庭关系、财务偏好,这些记忆的归属权却不在你手里。
文章
功能
无论是哪家公司的记忆功能、项目空间还是个性化设置,底层逻辑完全一致:你的信息上云,AI变聪明,你失去控制。
文章
内容
OpenAI同时提醒:Chronicle会快速消耗调用额度,还会增加提示词注入攻击风险(恶意指令可能通过显示的网页植入),且记忆内容在设备上以未加密形式存储。
文章