登录

富士通介绍PHOTON框架:1.2 B模型多查询性能475倍于Transformer



速读:
2026年06月25日 17:59

IT之家 6 月 25 日消息,富士通 (Fujitsu) 日本当地时间昨日介绍了其开发的 PHOTON(自上而下网络并行分层计算)架构,宣称其在多查询 (生成多个备选结果并在此基础上给出最终答案) 场景下性能至高可达主流 Transformer 架构的 475 倍。

富士通表示,Transformer 架构的一大弊病是其在长上下文输入或多线程同步处理的场景下会执行大量访存操作来保留历史信息,这往往会导致处理速度下降。 PHOTON 能高效率低开销地处理智能体系统等多 I/O 流程 ,从而降低 GPU 成本。

PHOTON 架构在语义层面上进行分层处理,相较 Transformer 的词元级分割可降低计算复杂度并提供了更好的并行性。而在多查询最后的决策环节,PHOTON 则采用了多数决定或选择最佳的方式,仅需一次推理。

测试结果表明,PHOTON 在 600M、900M、1.2B 等参数规模相对较小的模型中可实现更高的迭代吞吐量和更低的内存占用,其中 1.2B 模型上实现了 475 倍性能和略低的质量。此外,由于 PHOTON 架构每次迭代所需的 KV Cache 更少,还能提升最大迭代次数。

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

OpenAI抢后台,马斯克抢前台 陌陌母公司挚文季报图解:营收24亿净利降19% 唐岩刚获派息超8000万 风口上的AI短剧人,如履薄冰

欧洲热浪已致上百人死亡 为何不开空调:侨胞直言这里之前基本没人装 国产超算靠自研CPU登顶世界第一 美国恼羞成怒:又要封杀指令集出口 华为系大获全胜!中国电信4万台服务器采购完成:鲲鹏生态拿下28000台 提车几天就变老款!上汽名爵车主集体投诉:谁愿当大冤种? 《GTA6》实体版没光盘惹争议 博主怒斥扼杀二手市场 14999元起最贵iPhone!苹果首款折叠屏手机确定7月下旬量产 华为擎云 H3550 商用智能手表发布:升级 6 LED + 6 PD PPG 模组、支持星闪查找 / 车钥匙 苹果今年最重磅的新品!折叠屏iPhone面板开始量产 中国博士后科学基金第79批面上资助拟资助人员名单公示 果切成了最脏水果:小心一口就中招

主题:多查询|475倍