和水滴聊聊，怎么用大模型造一个接近99%真人水平的「Sales Agent」

速读：早在2021年，水滴就想做这样一款AI保险客服，对标真人水平、能弥补保险经纪人的服务供给不足问题。这一段对话，看起来平平无奇——但如果告诉你这是AI保险客服和用户进行的语音对话，那你一定会有点惊讶。本质上，水滴是在把这些数据去粗取精之后，相当于「用前10%经纪人的水平去训练大模型」，最终使得Agent能够达到中等经纪人的水平。在沈鹏看来，水滴要做的是大模型的中间层和应用层，更聚焦在保险产业的各种场景，不断优化大模型来提升内容生成的质量。

2024年12月12日 17:54

摘要

不走通用大模型之路，通过垂直场景数据对模型进行微调、打造出能独立完成复杂销售工作的Sales Agent。

「保费 52 元是什么意思？」

「这个价格其实是根据您的年龄，以及您过去的病史，我们测出来的保费，您今年 43 岁，算下来每个月就是 52 块钱，是这样的。」

「之前被狗咬了也没报呀？」

「嗯嗯，这个是要根据您购买的保险条款来的，不是每个都能报的，能报的我们要看政策，所以您可以看到有的病也不能报。」

……

这一段对话，看起来平平无奇——但如果告诉你这是 AI 保险客服和用户进行的语音对话，那你一定会有点惊讶。

对话里，它完全能理解用户在问什么，能给出专业的回答，情商、智商都在线，声音像真人一样，语气和停顿自然、「嗯嗯啊啊」的废字都很真实。以至于用户在对话过程中感受非常顺畅自然，不会过于生硬。就这样，他们聊了 50 分钟——如果说图灵测试（注：1950 年图灵提出的，用于测试某机器是否具备人类智能的方法）是标尺的话，那这场对话几乎可以说 AI 已通过了测试。

电话那头的 AI 保险客服，是由水滴公司开发出的一款保险 Sales Agent。在人工智能领域，Agent 并不是直译「代理人」的意思，而是代表具备自主性、适应性、交互能力、能够自主学习和持续进化的软件或系统。

这家 2016 年成立的公司，业务聚焦在健康保障领域，2017 年推出了保险经纪平台「水滴保」，累计服务超 1.1 亿保险客户。

早在 2021 年，水滴就想做这样一款 AI 保险客服，对标真人水平、能弥补保险经纪人的服务供给不足问题。在 2022 年大模型浪潮到来之后，这个设想才真正提速了——根据通用基座模型以及水滴积累的优质保险语音语料库，它在一年内做出了这个媲美真人 99% 水平的 AI Agent。

衡量一个保险 AI Agent 是否真有用的标志，是看它是否走进了业务、带来了成交。水滴公司创始人兼 CEO 沈鹏告诉极客公园，该公司「意外险」、「医疗险」等险种的部分电话客服工作已经由 AI Agent 承担。

大模型浪潮这两年来，国内外科技公司都希望能拥抱大模型、改造自身业务，而水滴是一个典型代表。相比于倾注精力攻坚通用大模型、期望实现 AGI 的公司，像水滴这样，在已有底座大模型基础上、结合垂直领域数据微调，打造垂直模型和垂直应用的路径或许更为适用。它也能将智能推到某个极限，并且创造出商业价值。

在沈鹏看来，水滴要做的是大模型的中间层和应用层，更聚焦在保险产业的各种场景，不断优化大模型来提升内容生成的质量。为了加强在中间层和应用层的科技探索，水滴每年的研发投入在 3 亿元左右。

随着技术不断迭代，水滴推出的 AI Agent 也在不断升级。下半年，水滴又推出了针对车险场景更复杂的 AI 客服——除了对话能力，它还长出了更复杂的规划能力，比如能在车险售卖的数月周期内，像人一样规划 5-6 次跟用户打电话的内容，一步步挖掘用户的真实需求，进而协助经纪人促进用户购买。

它还有复杂的多模态和操作交互能力，能在跟用户沟通的同时，一边「看」保险系统的数据，一边用「手」输入和查询数据，一边「穿梭」于微信等不同的通讯软件间，协助经纪人，解答客户的疑问。

目前，水滴计划将这些保险 AI Agent 的技术能力打包成 SaaS 产品，向其他有大规模坐席客服岗位的行业输出解决方案。

极客公园在跟水滴相关负责人交流之后，能感受到这款 AI Agent 的复杂性，也了解了这款逼近真人水平的 AI 保险客服的诞生过程、以及背后的技术积累和迭代思考。从中，不仅可以看到水滴这家科技公司在大模型上的行进经验，另外对于 AI 能实现的惊人潜力，也被隐隐勾勒了出来。

正在「充分智能化」的 AI 保险客服

AI 智能水平的判断尺往往是人类。现在大模型的智能评价标准，也是能否达到真人水平。而水滴，造出了接近真人 99% 水平的 AI 保险客服，后者能跟人类通话 50 分钟以上、且对话过程非常顺畅，这到底是怎么做到的？

把这个问题抛给水滴公司 AI 研发与产品部的同事 Star，在他眼里，造一个「人」实际上是可以工程化拆解的问题。以保险经纪人为例，核心是三点，智商（IQ）、情商（EQ）、多模态交互能力，而这些都可以用数据训练出来。

一方面是智商（IQ），由于保险是一个相对复杂的业务，它的核心就是要理解不同保险产品的健康告知、保障范围、理赔条款等，结合用户的问题和情况，理解其上下文语义交互，给出合理的回复和建议。在这点上，AI 甚至能做得比人类更好。

比如在记忆力上，人类无法清楚、全面记住所有的保险知识，但 AI 能用知识库实现这一点。当用户问自己做开颅手术、得了糖尿病，保险能不能保，人类可能得支支吾吾、去查询一下相关条款。但 AI 能直接给出准确的答复。

另一方面是情商（EQ），这本质是一种情绪价值，能让人觉得对方懂自己、沟通中感到「顺畅」和「亲切」。目前市面上的大模型基本是问什么回复什么，没有给到太多情绪价值。在水滴团队看起来，情绪价值是人类特有的能力。但实际上，AI 也能学、甚至能比人类做得更好。

在实际案例中，有一位用户提到自己几年没出过车险了，一般经纪人可能会回「好的」。但 AI 保险客服回了一句，「哥，你技术真好」。这说明，它不仅完全听懂了该用户有安全意识、保险记录良好，并用一种超高情商的方式进行了回应。

最后，关于多模态交互能力，包括响应时间、音色、口语化等等。这同样是可以学习的，人语气里的「嗯嗯啊啊」、一般人说话会停顿几秒……AI 都可以从人类的通话数据中学习、模仿。同时，语音的训练也从原来的 TTS（文本转语音）变成端到端，这能生成更自然的对话。

在 Star 看来，能训练出这样的 Agent，最核心在于水滴过往积累的数据。水滴从成立起就定位为一家科技公司，每年的研发投入在 3 亿元左右、累积有数十项技术专利，并且一直有意识地积累数据。过往，水滴不仅积累了数 T 的优质语音语料库，而且数据质量非常高，提前做过语音清洗、很多语音甚至是双通道存储。这样的数据很多传统公司都没有。

本质上，水滴是在把这些数据去粗取精之后，相当于「用前 10% 经纪人的水平去训练大模型」，最终使得 Agent 能够达到中等经纪人的水平。

「科技与保险业的结合将越来越紧密，这是行业发展的必然趋势」，沈鹏表示，保险业已经进入由科技驱动的「数智化」时代，科技驱动保险业高质量发展，助力行业降本增效，能够为用户、保险机构、线下经纪人提供更高效的科技产品和工具，推动行业进一步发展。

用 AI 解决保险行业的供给端不足

早在 2021 年，大模型出来之前，水滴就希望用 AI 造一位保险客服。本质上，这是希望解决保险业的供给端不足问题。

保险业务占据大头的水滴，拥有众多保险经纪人。他们大部分卖复杂的重疾险、兼带着卖简单的医疗险等。这些保险经纪人的工作，核心是提供专业咨询和服务能力。当用户有保险购买意向后，给他们打电话，讲解产品、解答疑惑，最终促成用户下单。

然而，过去水滴发现，有些保险经纪人的服务供给并不足够好。保险条款规则复杂、细碎，人很难都记住。比如医疗险涵盖上百种疾病，用户问到其中一种，经纪人可能答不上来，而这会影响用户体验。同时，经纪人的服务供给往往参差不齐，头部 10% 的经纪人服务水平可能是尾部 10% 的数十倍。

团队想到，可以用 AI 打造一位保险客服，协助经纪人解决服务体验的问题。而基于对大数据和深度学习路线的相信，团队认为，通过保险经纪人优质语料的不断学习、技术上能让 AI 达到真正保险经纪人的水平。

他们定的目标很高，一定要逼近真人的水平，也就是说不是 Copilot（副驾驶）、一定是 Agent——一方面在于，只有这样的技术水平，产品才能大规模铺开。另一方面，AI 研发的成本过高，只有具备这样的价值、最终才能算得过账。

回看当时水滴提出的此目标，其实非常接近 AGI 的设想。AI Agent 几乎是这轮 AGI 梦想的起点，据极客公园了解，OpenAI 创立之初的愿景就是打造一个「无所不能」的 Agent，它能响应人类的指令、自主执行所有的操作。简单来说，就是像人一样。现在，经过两年的人工智能热潮，AI agent 也是目前市面上最热的 AI 应用方向。

但水滴做出这个设想时，技术还远远没有成熟。 Star 介绍，2018 年，市场上还只有 1 亿参数开源模型。2021 年，只有数亿参数的可用开源模型。当时水滴基于这种技术底座做的 AI 保险客服，跟用户的对话时长只有 1-2 分钟。本质上，在底层 AI 通用能力没有达到的时候，上层的智能很难突破、也很难算得过账。

而 2022 年底 ChatGPT 大模型的出现，让一切按下了加速键。

看到 ChatGPT 后，水滴团队几乎立刻做出一个判断：只要手里有 ChatGPT3.5 水平的开源模型底座，结合水滴过去的保险经纪人语料库，一定能训练出一个接近真人水平的 AI 保险客服。他们认为开源的时间大概在三年左右，也就是说这件事将在三年内实现。

基于这个判断，水滴团队开始全力攻 AI Agent 方向。Star 认为，大模型浪潮给团队带来的直接影响是，让 AI 变成了「真正的智能」，这让整个公司给了他们更大的信心和支持。

这种支持除了来自 AI 研发上的资金投入，还来自于对行业最优秀人才的追逐。沈鹏介绍，人才是水滴最宝贵的资产，作为一家科技公司，水滴时刻关注前沿技术，也组建了一支既懂保险又懂人工智能的研发团队，核心成员均来自北大、清华、中科院等名校。

实际上，AI 的发展速度比想象中更乐观，当全球的科技公司都在追逐大模型，GPT3.5 水平的开源模型底座比想象中释放得更快。水滴团队通过计算判断，在这样的技术栈发展下，水滴 AI Agent 的智能水平平均每个月能提升 5% 左右，大概一年内就能在部分医疗险场景达到人类保险经纪人的平均水平。

从 2022 年 11 月正式投入算起，到今年年初——团队用一年多的时间，实现了这个结果。

迭代，做更复杂的 AI 车险客服

上述具备逼近真人水平通话能力的 AI Agent，主要用于比较简单的险种，如意外险、医疗险等。2023 年，水滴自研出保险垂直模型「水滴水守大模型」，技术的累积让团队得以深入到更复杂的险种，如车险。下半年，团队旨在打造一个车险 AI Agent，其复杂度又上了一个台阶。

车险的场景一般是，在用户的车险到期前 1 个月，各家车险公司的客服会与用户联系、并后续多次沟通，说服他们买自家的车险。车险经纪人不能只是打电话，还得进行任务规划、巧妙沟通、执行操作等，AI 有接近一半的时间在做沟通准备、总结、客户资料分析等工作。这对 AI Agent 的考验更大了。

比如任务规划，它指的是在一定的销售期内，车险客服需要规划和用户沟通的次数。既不能过于频繁、以免招惹他们厌烦，也不能过于冷淡、以免丢失销售线索。

对应到 AI Agent，实际上要求它有更高的智商（IQ）。它需要自主规划沟通几次，应该什么时候沟通，分别聊什么样的内容。「整个系统特别复杂，一次出错，就没法走了。」Star 说。

又比如巧妙沟通，由于车险的沟通频次更高、沟通空间更大，这考验经纪人更强的沟通能力。比如怎么衔接上一次的对话、怎么应对顾客的讲价、怎么在满足顾客诉求的同时保证公司利益，这本质上要求 AI 有更高的情商（EQ）。

在 Star 看来，以上对 AI Agent 更高的能力考验，需要通过迭代底层模型、加上高质量数据的微调实现。

在底层模型上，由于该 Agent 能力要求更复合，因此不是单一模型能搞定的。团队需要用到不同的模型，结合不同模态、不同大小模型各自的优势。比如大模型推理能力强，小模型拟合场景数据能力强，多模态模型能进行更多用户信息识别等。在这款车险 Agent 背后，水滴用到了多个大模型。

另外，依然要做好高质量数据的微调。当某一项能力不足的时候，就去筛选更好的人工数据进行训练，直到训练出效果为止。

在上述能力之外，该 Agent 还需要进化出操作执行能力。比如在协助经纪人与客户沟通时，Agent 可能要进入保险后台查数据、输数据、算数据等；需要切换不同的软件界面，比如电话、微信、app 等页面，跟用户沟通；也需要理解每一次用户的不同需求，为下一次聊天做准备等等。

在 Star 看来，这主要用到传统的 RPA（机器人流程自动化）技术。它相当于让 Agent 长出了人的「眼睛」和「手」，能够一边「看」不同的软件界面、一边「动手」操作。

这背后，是水滴根据不同阶段的技术形态，对产品的不断迭代。从只能简单协助沟通医疗险种 AI 保险客服，到能自主规划、能看能动手的 AI 车险客服，水滴不断解锁更复杂的保险场景，推高技术和应用的上限。

目前，这些 AI 保险客服已经被用到了水滴的真实业务当中，可以为用户随时解答疑惑。「大模型带来的是全新的生产力，它带来的是供给侧改革，这是根本的变革。」沈鹏说。

过去，人们提到保险经纪人最不可替代的价值是「信任感」。由于保险条款复杂，一般人并不具备看懂、分辨的能力，只能选择相信保险经纪人。他们倾向于跟亲朋好友、从业多年的经纪人购买保险，因为他们更有「信任感」，不会欺骗自己。

Star 认为，所谓的信任感，其实就是一种专业的服务能力。「当 AI 能协助提供更专业的服务，你也会信任它。」

有了这样的 AI Agent，人类保险经纪人的工作也发生了一些变化。他们中的有一些人，已经变成了 AI 训练师。而对于更多保险经纪人来说，他们开始将 Agent 作为自己的助手、为用户提供更复杂的保险服务，比如更长生命周期的保险规划等。

主题：水滴|大模型|对话|AI保险客服|中间层和应用层