2025年，AI Agent还会是风口吗？11个问题揭秘智能体技术发展全貌

速读：其中，Meta的Llama、Mistral和Cohere虽然影响力较小，但增长势头不容忽视，显示出基座大模型市场的激烈竞争。 11个问题揭秘智能体技术发展全貌2024年12月19日15:53IT之家经过了LLM、RAG、多模态等多轮技术风口的洗礼后，AI智能体的应用现状究竟如何？ 2024年，AI智能体技术无疑是科技界的焦点。问题4：哪些因素影响大模型的选择。然而，该调查中揭示的开发者关注的问题，例如更看重准确性、安全性和可定制性，而成本因素影响较小，以及偏好灵活、可定制的AI流水线开发工具，并重视AI智能体版本控制功能。

2024年12月19日 15:5

经过了 LLM、RAG、多模态等多轮技术风口的洗礼后，AI 智能体的应用现状究竟如何？Langbase 公司最近发布的调查报告通过 11 个关键问题，为我们提供了一份有价值的现状切面。

2024 年，AI 智能体技术无疑是科技界的焦点。

通过对来自 100 多个国家的 3400 名开发者进行深入调查，Langbase 公司近日发布的一项报告揭示了智能体开发中的关键问题。这项调查的受访者中，有 46% 是企业领导层，26% 是工程师。

Langbase 专注于提供无服务器的 AI 云开发体验。作为一个提供可组合基础设施的 AI 平台，他们在 2024 年一共处理了来自 3.6 万开发人员的 1840 亿个 token 和 7.86 亿个 API 请求。

提起 Langbase 这个名字，你也许不太熟悉。事实上，这家公司非常年轻，2023 年刚刚成立。

根据 Crunchbase 披露的数据，他们刚刚才在 9 月份进行了 pre-seed 轮融资，但已经得到了谷歌、苹果、OpenAI、微软等大厂高管们的资金支持。

下面就让我们一起来看看这家年轻有为的 Langbase 发布的这份图文并茂的报告中究竟提到了哪些内容。

问题 1：开发者在使用哪些基座大模型

在这场 AI 智能体的竞赛中，OpenAI 的大模型服务占据了主导地位，但谷歌正迅速崛起，成为其强劲的竞争对手，Anthropic 紧随其后。

其中，Meta 的 Llama、Mistral 和 Cohere 虽然影响力较小，但增长势头不容忽视，显示出基座大模型市场的激烈竞争。

问题 2：不同大模型对应的具体用途

OpenAI 在翻译任务中被广泛应用，Anthropic 在技术任务中备受青睐，而谷歌的模型在健康和翻译领域占据主导地位。

此外，Meta 在科技和科学应用中得到了广泛使用，Cohere 也在多个领域得到重视，包括科学和营销。

问题 3：哪些因素阻碍了你对大模型技术的应用

在模型的扩展和部署中，数据隐私和安全合规性成为主要关注点，「缺乏监控工具」和「高基础设施成本」这两项因素也阻碍了技术的落地应用。

对 AI 驱动解决方案的抵制或怀疑反映了使用者们的长期顾虑，这表明，模型和技术的提供商们需要更加透明和用户友好的 AI 平台。

问题 4：哪些因素影响大模型的选择

在选择大型语言模型（LLM）时，准确性是最重要的因素，其次是安全性和可定制性，成本的影响相对较小。

问题 5：在部署大模型时，你遇到的最大挑战是什么

在生产环境中部署大模型和智能体面临着种种关键挑战，包括定制困难、质量保证评估方法有限，以及缺乏可重用的基础设施。

此外，工具碎片化、集成问题和可扩展性等方面的顾虑进一步复杂化了这个过程。

问题 6：采用大模型技术时，你的主要目标是什么

「自动化」和「简化」是 AI 应用的首要任务，使公司在效率和流程简化方面受益；此外，定制解决方案和提升合作流程等方面的目标，反映了大模型日益增长的灵活性，以及消费者对系统共享访问的兴趣。

问题 7：您的公司如何使用大模型智能体

LLM 在软件开发中得到广泛应用，尤其在市场营销、IT 运营和文本摘要等方面，客服、人力资源和法律领域的使用兴趣也在日益增长。

问题 8：哪些平台特征对你至关重要

大多数受访者都需要多智能体检索增强生成（RAG）功能以提高上下文信息处理，同时，评估工具对于确保人工智能系统按预期工作也很重要。

问题 9，在编排 AI 流水线时，开发者偏好哪种工具

大多数受访者更喜欢能提供灵活、基础原语的开发工具以设计定制 AI 流水线（pipeline）。预构建的、针对特定问题的解决方案虽然可以直接解决具体问题，但它们的可定制性较低。

问题 10：什么因素影响大模型智能体开发工具的选择

开发者将 AI 智能体的版本控制视为开发平台最重要的功能。强大的 SDK 或库生态系统以及本地开发环境也受到重视。

问题 11：大模型在公司中的应用程度

大多数开发者将 AI 用于实验和生产。相比之下，实验用途的比例远远大于生产用途，但后者的比例仍在稳步前进的过程中。

随着 AI 智能体基础设施的成熟，越来越多的企业会尝试开发智能体，而随着多模态及大模型操作计算环境（例如 Claude 通过接口在线互动）的发展，智能体在 2025 年的应用将更加广泛，甚至不仅仅局限于报告中提到的软件开发、市场营销、IT 运营和文本摘要等领域。

然而，该调查中揭示的开发者关注的问题，例如更看重准确性、安全性和可定制性，而成本因素影响较小，以及偏好灵活、可定制的 AI 流水线开发工具，并重视 AI 智能体版本控制功能。

无论技术怎么进步，这份调查结果都会对智能体平台及开发者有参考价值。

参考资料：

https://langbase.com/state-of-ai-agents ?genai

https://x.com/MrAhmadAwais/status/1866483416981786821

本文来自微信公众号：新智元（ID：AI_era）

关键词 :

智能体 AI 开发者

新浪众测

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

“垃圾外卖”背后推手：批量复制门店，加盟狂揽2000万

手机应用偷听用户投放广告，有哪些法律问题？

裁员风波背后，海康威视的触顶挑战

扎心！一男生被女友咬伤住院：引发15万网友热议转发

曝华为畅享系列回归麒麟5G平台：替代高通芯片

女子胆囊内竟藏400多颗结石：腹痛呕吐无法进食

2024年Q3中国大陆PC销量排行榜：华为跻身前三软通动力暴涨123%

华为打造千兆全覆盖标杆：现网“0”改动平滑升级千兆

英伟达AI芯片最大买家揭晓！微软力压同行霸榜

小学生集卡成瘾遭官媒曝光 “谷子经济”龙头卡游推迟香港上市计划

字节跳动正式发布豆包视觉理解模型：1元可处理近300张高清图

2024抖音年度热梗出炉：city不city、我有一个帽衫等上榜

苹果正与腾讯、字节谈判：将人工智能整合国行版iPhone中

首次！比亚迪海豹荣获日本年度风云车“十大最佳车型”奖

联想参与某计算机集采项目未通过初审竟因一投标文件名称错误？

车主办完贷款被告知车卖给了别人宝马4S店给银行的登记证书是假的

极越员工万字长文吐槽夏一平：长不大的200斤孩子

极越闪崩后坑惨迪拜员工：我们还有500台库存车未卖

上周理想汽车销量上涨至1.4万小鹏0.72万问界0.67万

2025 款奥迪 Q7 燃油 SUV 上市：增加 4 种车漆、全新扁平化四环车标，60.98 万元起

蔚来被质疑有钱不给供应商？李斌回应称付款周期为验收后90天

极越员工称解决方案陷入僵局吉利已确认百度待审批

比亚迪海外市场再下一城！已与6家韩国经销商签约明年1月正式入驻

主题：模型|技术|智能体|应用|基础设施|AI智能体