登录

如果拥有AI公司的能力,银行将会变成怎样?


速读:去年6月,招商银行正式对外宣布。 今年4月,信息技术部总经理夏雷在同一栋楼的邻近办公室里,对36氪回忆起那个时刻。 全球AI科技公司的创新也正印证这一点:无论是模型架构优化、推理加速,还是显存压缩、网络调度,所有底层技术突破,最终都指向算力效率提升与成本下降,这就是所谓的“Token经济学”。 深入技术层面,招商银行始终瞄准全球最前沿方向,如大模型推理的核心瓶颈在于显存与算力消耗,招商银行通过改造注意力算法降低显存消耗放大上下文长度、KVCache缓存复用点积结果降低算力开销、算力卡细颗粒度虚拟化提高算力利用率、跨服务器卡间直接通讯降低网络延迟等等。
2026年05月14日 21:3

AI全栈自研不只是口号,

更是笔划算的长期生意。

深圳的创新脉搏,大半都落在深南大道上。

这条横贯福田与南山的城市主轴,一边串起招商银行大厦等金融地标,一边延伸至腾讯、百度等科技巨头云集的南山科技园。

招商银行总行信息技术部就坐落在这条大道沿线的科技产业带上,其下有超过一万名员工。

2023年底,一场围绕“AI将把银行带向何方”的高层战略会议,在招行信息研发大厦悄然进行。今年4月,信息技术部总经理夏雷在同一栋楼的邻近办公室里,对36氪回忆起那个时刻。他说,那是招行内部将AI提升到全新战略高度的起点。

去年6月,招商银行正式对外宣布“AI First”战略。这一年,招商银行AI技术与应用出现爆发式增长。2025年年报显示,AI日均Token吞吐较2024年增长10.1倍,全年落地183个金融垂直领域专精模型、856个业务场景应用,AI替代人工工时达1556万小时。

相似的表达风格体现在与夏雷的对话中。其很少谈论银行的传统指标,却频繁提及算力、Token经济学等AI概念。

在他的表述中,招商银行做AI的逻辑,不是银行信息化的延伸,而是以一家科技公司的视角,探索面向未来的银行核心能力。

正如信息技术部的选址一样,置身于 AI、算力、大模型最活跃的产业氛围中,更能与科技公司共享同一种创新语境。

“如果一家银行拥有了AI科技公司的能力,这家银行会变得怎样?”这是夏雷提出的一个没有答案的问题。

全栈自研,

算清了AI这笔长期账

根据夏雷对行业的判断,银行AI的核心竞争力,早已不是容易模仿的场景应用,而是围绕算力卡、底层软件、模型形成的完整技术体系,能以更低的token成本支撑更高的应用价值。

他提到,当前AI技术远未到达天花板,几乎每几个月就会出现新的优化方向,带来Token成本的大幅降低,存在巨大的技术红利空间。这种持续迭代的特性,决定了核心能力必须掌握在自己手中。

全球AI科技公司的创新也正印证这一点:无论是模型架构优化、推理加速,还是显存压缩、网络调度,所有底层技术突破,最终都指向算力效率提升与成本下降,这就是所谓的“Token经济学”。

夏雷认为,要获取这些红利,就要自主掌握底层技术,紧跟技术趋势。未来Token的需求还会以数量级增长,如果没有低成本的Token供给能力,仅是算力卡采购的财务投入,就将成为一笔巨额投入,因此,全栈自研道路成了必然选择。

而国内AI厂商的商业模式,进一步强化了招商银行自研的必要性:头部科技公司更倾向于面向海量用户的云服务与Token售卖,To B深度定制投入产出比偏低,难以投入顶级人才为单家银行做长期深度适配;中小厂商则无法覆盖从算力底座、训练框架、推理引擎到垂直模型的全栈技术,生存稳定性与服务持续性都存在不确定性。当一家银行把AI定位为未来核心竞争力时,就不可能把命脉交给商业模式尚不清晰、技术覆盖不完整的外部伙伴。

对招商银行而言,全栈自研不是可选项,而是决定长期生存的核心基础能力。

“头部互联网公司为什么全都选择全栈自研?答案是一样的。”夏雷的这句话,点破了招商银行的底层逻辑。当AI成为数字经济的核心生产力,拥有海量用户、复杂场景、高安全要求的机构,最终会走向同一条路——自主掌控核心技术。

支撑全栈自研走下去的,不是情怀与投入,而是一套可量化、可验证、可复制的价值体系。

夏雷透露,招商银行内部建立了严密的AI价值度量机制:以同一业务流程在“有AI”与“无AI”状态下的业务差异为基准,折算成可对比的经济价值;成本端则全口径纳入硬件投入、研发人力、业务投入、运维保障等支出,最终算出真实的投入产出。

这一标准下的数据给出了最有说服力的答案:2025年,招商银行AI投入的成本收入比为24%,低于银行业常规30%左右的水平。

这意味着,投向AI的资源,能够带来比传统资本投入更高的回报。“一开始大家觉得银行AI应用处于投入阶段,真正算出数据后,结果超出了预期,证明我们的模式已进入可持续发展阶段。”夏雷表示。

财务验证让长期主义成为全行共识。招商银行在AI上的投入,不是短期业绩冲刺,而是一场瞄准未来的马拉松,全栈自研看似沉重,实则在长期维度上更轻盈、更可持续。

银行,正变成科技公司

去招商银行总部逛一圈,可发现“AI First”不是一句贴在墙上的标语,而是渗透在战略决策、组织管理、业务运行的每一个环节。

当行业还在讨论“科技赋能业务”时,招商银行已经实现“科技引领业务”——组织形态、运行逻辑、创新方式全面向科技公司靠拢。

战略层面,AI被提升至全行最高优先级。例如,现阶段招商银行AI推广由科技条线牵头推动,而不是传统模式下的业务部门提需求、科技部门做执行。信息技术部不仅负责技术研发,还要主动挖掘场景、推动业务落地、组织标准评价。在很多银行,科技是后台支撑;在招商银行,科技更像是前台引领。

深入技术层面,招商银行始终瞄准全球最前沿方向,如大模型推理的核心瓶颈在于显存与算力消耗,招商银行通过改造注意力算法降低显存消耗放大上下文长度、KV Cache缓存复用点积结果降低算力开销、算力卡细颗粒度虚拟化提高算力利用率、跨服务器卡间直接通讯降低网络延迟等等。这些技术,使得招行以不算多的算力卡,支撑起了日均超260亿Token的吞吐。

除了将这些技术应用于自身业务之外,招商银行还大量开源,为AI生态建设作出自己的贡献。

目前其已为主流AI社区贡献了超过50个关键特性,并且是两大主流开源项目的维护者。据夏雷介绍,这在当前金融机构中是唯一一家。今年,招行还与阿里魔搭社区联合发布了大模型开源训练框架Twinkle。

这类技术看似聚焦底层,却直接决定模型运行成本与用户体验。这正是科技公司与传统机构信息化的核心差距。

而延伸到业务层面,夏雷有一个朴素的判断:AI模拟人的思考,只要有人需要判断、决策、处理信息的地方,AI就有应用价值。

如今在招商银行的业务链条上,越来越多人工分析的工作正被AI辅助完成,AI不再是独立的系统,而是嵌入流程的隐形能力,让每一个岗位、每一个环节都变得更高效、更精准。

通用模型与公有云方案无法满足金融场景的严苛要求,只有基于场景特点、自身数据、业务规则与监管要求深度定制,才能实现技术与业务的完美匹配。截至2025年底,招商银行已在金融垂直场景打造183个专精模型。

同时夏雷也认为,模型不求大而全,而更应看重其是否在特定领域达到SOTA(State of the Art)水平——即在响应速度、高并发支撑、金融专业准确度、风险控制等关键指标上达到行业最优。其透露,目前招商银行通过修改模型结构、再训练等方式,诸多模型的关键指标已达到国内领先水平。这种垂直深耕的能力,让招商银行的AI模型在真实业务中,具备了外部方案无法比拟的实用性与稳定性。

从战略优先到技术深耕、全栈自研,招商银行在AI上的整套策略,已区别于传统银行的范式,更接近一家领先的科技公司。AI重构金融行业的浪潮下,这种科技公司化的转身让招商银行提前占据了主动。

主题:科技|夏雷|招商银行|模型|科技公司|信息技术部|全栈自研|核心能力